ピンタレストでの大規模学習型検索システムの構築 ノート

ピンタレストでの大規模学習型検索システムの構築

Pinterestでは、ユーザーが愛する生活を創造することをミッションとしており、オンライン上での適切なコンテンツの発見がこのミッションにとって非常に重要です。同社のレコメンデーションシステムは、ユーザーに適切なコンテンツを提供するために、複数のステージ、つまり検索とランキングを含みます。ランキングモデルは、ユーザーの長期的および短期的なエンゲージメントを捉える強力なトランスフォーマーベースのモデルですが、検索システムは以前はヒューリスティックアプローチに基づいておりました。同社は、この改善のために、ログされたユーザーエンゲージメントイベントから学習された内部の埋め込みベースの検索システムを構築し、ホームフィードと通知に展開しています。このシステムは、2つのタワーアプローチを使用し、1つのタワーがクエリーの埋め込みを学習し、もう1つのタワーがアイテムの埋め込みを学習することで、オンラインでの効率的な近傍検索を可能にします。モデルは、人気バイアスを補正するためにサンプルドソフトマックスアプローチを使用してトレーニングされ、ユーザーの長期的なエンゲージメント、プロフィール、およびコンテキストが入力としてエンコードされます。システムデザインでは、アイテムの埋め込みをオンラインでの提供とオフラインでのインデックスに分割し、自動的な再トレーニングワークフローを使用してユーザーの最新のトレンドを捉えます。モデルバージョンの同期を確保するために、各ANN検索サービスホストにモデルバージョンのメタデータが付与され、モデル名から最新のモデルバージョンへのマッピングを保持します。学習された検索候補ジェネレーターは、トップユーザー覆盖率とトップ3のセーブ率を達成し、サイト全体のエンゲージメントの勝利に大きく貢献しています。
CdXz5zHNQW_jl6TXRt0LH.png