RSS Stories by Pinterest Engineering on Medium
Подписаться
Обслуживание моделей Two-Tower на GPU для прогнозирования вовлеченности в рекламу с небольшим весом
Pinterest разработал новую двухбашенную модель с обслуживанием на GPU для облегченного ранжирования рекламы. Эта модель использует архитектуру MMOE-DCN для баланса между производительностью и задержкой обслуживания. Этап облегченного ранжирования эффективно сужает список кандидатов на рекламу для последующих моделей. Эта новая архитектура заменила предыдущую модель MTMD и включила обновления функций. Они добились снижения потерь в автономном режиме на 5-10% для прогнозирования CTR. Дальнейшая сегментация стандартной и торговой рекламы также улучшила снижение потерь и скорость итерации модели. Эффективность обучения была повышена за счет оптимизации загрузчика данных, корректировки кода модели и настройки конфигурации обучения. Оценка проводилась с использованием потерь KL-дивергенции, и модель оценивалась на победителях аукционов и кандидатах. Онлайн-эксперименты показали значительное снижение CPC и увеличение CTR. Проект принес существенные улучшения в автономных и онлайн-метриках. Этот прогресс означает развитие в масштабировании рекомендательных систем с более сложными и эффективными моделями. Проект был совместной работой нескольких команд в Pinterest.