Функция поиска Airbnb играет ключевую роль в помощи гостям найти идеальное жилье, но это сложная задача из-за большого количества доступных домов и сложных запросов поиска. Для решения этой задачи Airbnb создала систему поиска на основе встроенных представлений (EBR), чтобы сузить начальную группу подходящих домов до меньшего пула. Система EBR состоит из трех ключевых компонентов: создания обучающих данных, проектирования архитектуры модели и разработки стратегии онлайн-обслуживания. Pipeline обучающих данных использует контрастное обучение для отображения домов и запросов поиска в числовые вектора. Архитектура модели следует традиционному двухбашенному дизайну, где одна башня обрабатывает функции списка домов, а другая - функции, связанные с запросом поиска. Башня списка домов вычисляется офлайн ежедневно, что уменьшает онлайн-задержку. Для онлайн-обслуживания Airbnb исследовала приближенные решения ближайших соседей (ANN) и выбрала индексированный файловый индекс (IVF) из-за его лучшего баланса между скоростью и производительностью. Решение IVF группирует списки домов заранее и извлекает дома из верхних кластеров, рассматривая назначения кластеров как стандартный фильтр поиска. Система EBR привела к статистически значимому увеличению общего количества бронирований при тестировании A/B, эффективно учитывая контекст запроса и ранжирование домов более точно при извлечении. Система была полностью запущена в производстве поиска и электронной маркетинговой рассылки.
medium.com
Embedding-Based Retrieval for Airbnb Search
Create attached notes ...