Die Suche von Airbnb spielt eine entscheidende Rolle bei der Suche nach dem perfekten Aufenthalt für Gäste, aber es ist eine herausfordernde Aufgabe aufgrund der großen Anzahl verfügbarer Häuser und komplexer Suchanfragen. Um dies zu bewältigen, baute Airbnb ein Embedding-basiertes Retrieval-System (EBR) zur Eingrenzung der initialen Menge an geeigneten Häusern auf eine kleinere Auswahl. Das EBR-System besteht aus drei Schlüsselkomponenten: dem Erstellen von Trainingsdaten, dem Entwerfen der Modellarchitektur und der Entwicklung einer Online-Dienststrategie. Die Trainingsdaten-Pipeline nutzt kontrastives Lernen, um Häuser und Suchanfragen in numerische Vektoren abzubilden. Die Modellarchitektur folgt einem traditionellen Zweiturm-Netzwerk-Design, wobei ein Turm Merkmale der Hausliste verarbeitet und der andere Turm Merkmale in Bezug auf die Suchanfrage verarbeitet. Der Listing-Turm wird täglich offline berechnet, was die Online-Latenz reduziert. Für den Online-Dienst erkundete Airbnb approximative nächste Nachbarlösungen (ANN) und wählte einen invertierten Datei-Index (IVF) aufgrund seines besseren Kompromisses zwischen Geschwindigkeit und Leistung. Die IVF-Lösung clusteriert Listen vorher und ruft Häuser aus den Top-Clustern ab, indem sie Cluster-Zuweisungen als Standard-Suchfilter behandelt. Das EBR-System führte zu einem statistisch signifikanten Anstieg der Gesamtbuchungen bei A/B-Tests, indem es den Kontext der Abfrage effektiver berücksichtigte und Häuser genauer bei der Retrieval rangierte. Das System wurde vollständig in der Produktion von Suche und E-Mail-Marketing lanciert.
medium.com
Embedding-Based Retrieval for Airbnb Search