Улучшения в поиске на основе в... Заметка

Улучшения в поиске на основе встраивания в ленте новостей Pinterest

В ленте новостей Pinterest использование метода поиска на основе встраивания является ключевым кандидатом для генерации, который извлекает высоко персонализированный и привлекательный контент для удовлетворения различных намерений пользователей. Команда представила двухбашенную модель с продвинутым пересечением функций и встраиванием идентификаторов для улучшения производительности модели. Пересечение функций является ключевым компонентом модели, и команда экспериментировала с различными техниками, такими как MaskNet и DHEN, для масштабирования архитектуры. MaskNet - это метод умножения функций, который упрощает архитектуру модели и обеспечивает высокую обучаемость с обширным пересечением функций. DHEN - это фреймворк, который объединяет несколько разных слоев пересечения функций как последовательно, так и параллельно, что приводит к дальнейшему улучшению модели. Команда также приняла заранее обученные встраивания идентификаторов с помощью контрастного обучения на выборочных отрицательных данных на большом оконном наборе данных. Однако прямое дообучение встраиваний может привести к переобучению, и команда обнаружила, что фиксация таблицы встраиваний и применение агрессивного дропаута может смягчить эту проблему. Команда также обновила корпус сервера, переключившись на суммирование с затуханием во времени для определения оценки Pin и закрытия разрыва между обучающими данными и серверным корпусом. Кроме того, команда исследовала передовые методы моделирования, такие как поиск на основе нескольких встраиваний и условный поиск, для дальнейшего улучшения производительности модели поиска на основе встраивания. Эти методы привели к значительному улучшению пользовательского взаимодействия и эффективности рекомендательного воронки.
CdXz5zHNQW_nRsW3jGDPy.png