ピンタレストホームフィードにおける埋め込みベースの検索の進歩
ピンタレストのホームフィードでは、埋め込みベースの検索が高度にパーソナライズされたコンテンツを取得するための主要な候補ジェネレーターです。チームは、2つのタワーモデルに高度なフィーチャークロッシングとID埋め込みを導入して、モデルのパフォーマンスを改善しました。フィーチャークロッシングはモデルの主要なコンポーネントであり、チームは、MaskNetやDHENなどの異なるテクニックを実験してアーキテクチャーをスケールアップしています。MaskNetは、フィーチャーベースの乗算テクニックであり、モデルアーキテクチャーを簡略化し、広範囲のフィーチャークロッシングによる高学習性を実現します。DHENは、複数の異なるフィーチャークロッシングレイヤーを系列および並列方式でアンサンブルするフレームワークであり、モデルのさらなる改善をもたらします。チームはまた、クロスサーフェス的大ウィンドウデータセット上での対比的学習によるプリトレンドID埋め込みを採用しています。ただし、埋め込みを直接ファインチューニングするとオーバーフィッティングが生じるため、チームは、埋め込みテーブルを固定し、アグレッシブドロップアウトを適用することでこの問題を緩和することを発見しました。チームはまた、時間減衰和を使用してPinのスコアを決定し、トレーニングデータとサーブコーパスのギャップを埋めるためにサーブコーパスを改修しました。さらに、チームは、マルチ埋め込み検索や条件付き検索などの最新のモデリングテクニックを探索し、埋め込みベースの検索モデルのパフォーマンスをさらに向上させています。これらのテクニックは、ユーザー エンゲージメントとレコメンデーションフンネル効率の改善に大きな影響を与えています。