Fortschritte bei der embedding... Notiz

Fortschritte bei der embedding-basierten Suche im Pinterest-Startbildschirm

Im Pinterest-Homefeed wird die embedding-basierte Suche als Schlüsselkandidatengenerator eingesetzt, um hochpersonalisierte und engagierende Inhalte abzurufen, um verschiedene Benutzerintentionen zu erfüllen. Das Team hat ein Zweiturm-Modell mit fortschrittlicher Feature-Überkreuzung und ID-Embeddings eingeführt, um die Modellleistung zu verbessern. Die Feature-Überkreuzung ist ein wichtiger Bestandteil des Modells, und das Team hat verschiedene Techniken wie MaskNet und DHEN erprobt, um die Architektur zu skalieren. MaskNet ist eine feature-weise Multiplikationstechnik, die die Modellarchitektur vereinfacht und eine hohe Lernfähigkeit bei umfassender Feature-Überkreuzung bietet. DHEN ist ein Framework, das mehrere verschiedene Feature-Überkreuzungsschichten in seriellen und parallelen Wegen kombiniert, was zu einer weiteren Verbesserung des Modells führt. Das Team hat auch vortrainierte ID-Embeddings durch kontrastives Lernen auf stichprobenweise negatives über ein großes cross-surface-Datenset adoptiert. Direktes Feintunen der Einbettungen kann jedoch zu Überanpassung führen, und das Team hat festgestellt, dass das Fixieren der Einbettungstabelle und das Anwenden eines aggressiven Dropout-Prozents dieses Problem mildern kann. Das Team hat auch den Servicedatenbestand renoviert, indem es zu einer zeitabhängigen Summation überging, um den Score eines Pins zu bestimmen, und die Lücke zwischen Trainingsdaten und Servicedatenbestand geschlossen hat. Darüber hinaus hat das Team state-of-the-art-Modellierungstechniken wie Multi-Embedding-Retrieval und konditionale Retrieval erforscht, um die Leistung des embedding-basierten Retrieval-Modells weiter zu verbessern. Diese Techniken haben zu signifikanten Verbesserungen bei der Benutzerbeteiligung und der Empfehlungsleistung geführt.
CdXz5zHNQW_nRsW3jGDPy.png