Einrichten eines großen, lernbasierten Retrieval-Systems bei Pinterest
Bei Pinterest ist die Mission, Benutzer dazu zu inspirieren, ein Leben zu schaffen, das sie lieben, und das Finden des richtigen Inhalts online ist für diese Mission von entscheidender Bedeutung. Das Empfehlungssystem des Unternehmens umfasst mehrere Stufen, einschließlich Abruf und Rangfolge, um den richtigen Inhalt an die Benutzer zu liefern. Das Rangfolgemodell ist ein leistungsfähiges, auf Transformern basierendes Modell, das die lang- und kurzfristige Interaktion der Benutzer erfasst, aber das Abrufsystem basierte zuvor auf heuristischen Ansätzen. Um dies zu verbessern, baute Pinterest ein internes, auf Embeddings basierendes Abrufsystem, das aus protokollierten Benutzer-Interaktionsereignissen gelernt wurde und für den Homefeed und die Benachrichtigung bereitgestellt wurde. Das System verwendet einen zweitürmigen Ansatz, bei dem ein Turm die Abfrage-Embedding und ein Turm das Element-Embedding lernt, was eine effiziente Online-Bereitstellung mit nächster-Nachbar-Suche ermöglicht. Das Modell wird mit einem stichprobenbasierten Softmax-Ansatz trainiert, um die Popularitätsverzerrung zu korrigieren, und die langfristige Benutzer-Interaktion, das Profil und der Kontext werden als Eingabe codiert. Das Systemdesign umfasst die Aufteilung der Element-Embeddings in Online-Bereitstellung und Offline-Indizierung, mit einem automatischen Neuausbildungs-Workflow, um das erlernte Wissen der Benutzer aufzufrischen und aktuelle Trends aufzugreifen. Um sicherzustellen, dass die Modellversionen synchronisiert sind, wird eine Stück Modellversion-Metadaten an jeden ANN-Suchdienst-Host angehängt, das eine Zuordnung von Modellname zur neuesten Modellversion enthält. Der erlernte Kandidatengenerator für den Abruf hat die beste Benutzerabdeckung und die besten drei Speicherraten erreicht und hat dazu beigetragen, zwei andere Kandidatengeneratoren zu ersetzen, was zu enormen Gesamt-Engagement-Erfolgen auf der Website geführt hat.