Déverrouiller la récupération efficace des annonces publicitaires : les plus proches voisins approximatifs hors ligne dans les annonces Pinterest
Pinterest utilise les voisins les plus proches approximatifs (ANN) en ligne pour la récupération de publicités, mais l'ANN hors ligne est également précieuse pour le traitement de données à grande échelle et les opérations économiques. L'ANN hors ligne précalcule les candidats hors ligne, idéal pour les scénarios avec un débit élevé et des réponses de requête à faible latence, ainsi que des requêtes statiques. Pinterest a réussi à appliquer l'ANN en ligne, mais fait face à des défis pour étendre son inventaire de annonces. La migration de l'algorithme de petit monde navigable hiérarchique (HNSW) à l'algorithme de fichier inversé (IVF) permet d'avoir un index plus large, mais augmente les coûts. L'ANN hors ligne bénéficie de ressources computationnelles abondantes et de tolérance à la latence, efficace pour les générateurs de candidats avec des contextes de requête statiques. La principale différence entre les approches en ligne et hors ligne est le moment de la recherche d'ANN. L'ANN hors ligne a des avantages, notamment l'efficacité coût et l'extensibilité, mais également des inconvénients, notamment les limitations en temps réel et les voisins fixes. Pinterest a évalué la récupération basée sur l'ANN hors ligne, notamment les annonces d'articles similaires et l'intégration d'éléments visuels. L'ANN hors ligne a montré de meilleures performances d'engagement et de conversion, et développe actuellement sa propre plateforme et son propre framework d'ANN hors ligne pour les avancées à venir.