Airbnbの検索機能は、ゲストが理想の滞在先を見つけるのを助ける上で重要な役割を果たします。しかし、利用可能な家が多く、検索クエリが複雑であるため、難しいタスクです。この課題に対処するために、Airbnbは、最初の候補となる家の集合をより小さなプールに絞り込むために、埋め込みベースの検索(EBR)システムを構築しました。EBRシステムは、3つの重要なコンポーネントで構成されています。トレーニングデータの構築、モデルのアーキテクチャの設計、およびオンライン提供戦略の開発です。トレーニングデータパイプラインは、コントラスト学習を利用して、家と検索クエリを数値ベクトルにマッピングします。モデルのアーキテクチャは、伝統的な2タワーネットワーク設計に従います。1つのタワーは家のリストに関する機能を処理し、もう1つのタワーは検索クエリに関する機能を処理します。リストタワーは、オフラインで毎日計算され、オンライン遅延が軽減されます。オンライン提供のために、Airbnbは近似最近傍隣接(ANN)ソリューションを探索し、速度とパフォーマンスのバランスが優れているため、逆ファイルインデックス(IVF)を選択しました。IVFソリューションは、事前にリストをクラスタリングし、クラスタ割り当てを標準の検索フィルターとして扱うことで、上位クラスタから家を取得します。EBRシステムは、A/Bテストで統計的に有意なブッキングの増加につながり、検索時にクエリコンテキストを効果的に組み込み、家のランキングをより正確に行うことができました。このシステムは、検索とEメールマーケティングの両方のプロダクションで完全に導入されています。
medium.com
Embedding-Based Retrieval for Airbnb Search
Create attached notes ...