에어비앤비 기술 블로그 - 미디엄

에어비앤비 검색을 위한 임베딩 기반 검색

에어비앤비의 검색 기능은 게스트가 완벽한 숙소를 찾는 데 매우 중요한 역할을 하지만, 방대한 숙소 목록과 복잡한 검색어 때문에 어려운 과제입니다. 이를 해결하기 위해 에어비앤비는 임베딩 기반 검색(EBR) 시스템을 구축하여 초기 후보 숙소를 더 작은 범위로 좁혔습니다. EBR 시스템은 훈련 데이터 구성, 모델 아키텍처 설계, 온라인 서비스 전략 개발이라는 세 가지 주요 구성 요소로 이루어져 있습니다. 훈련 데이터 파이프라인은 대조 학습을 활용하여 숙소와 검색어를 숫자 벡터로 매핑합니다. 모델 아키텍처는 기존의 투 타워 네트워크 설계를 따르며, 하나의 타워는 숙소 목록에 대한 특징을 처리하고 다른 타워는 검색어와 관련된 특징을 처리합니다. 숙소 타워는 매일 오프라인으로 계산되어 온라인 지연 시간을 줄입니다. 온라인 서비스를 위해 에어비앤비는 근사 최근접 이웃(ANN) 솔루션을 탐색했고 속도와 성능 간의 균형이 더 나은 역색인 파일(IVF)을 선택했습니다. IVF 솔루션은 미리 숙소를 클러스터링하고 클러스터 할당을 표준 검색 필터로 처리하여 상위 클러스터에서 숙소를 검색합니다. A/B 테스트 결과 EBR 시스템은 전체 예약 건수에 통계적으로 유의미한 증가를 가져왔으며, 검색 시 쿼리 컨텍스트를 효과적으로 통합하고 숙소 순위를 더 정확하게 매기는 데 기여했습니다. 이 시스템은 검색 및 이메일 마케팅 운영에 완전히 출시되었습니다.
medium.com
Embedding-Based Retrieval for Airbnb Search
에어비앤비 검색을 위한 임베딩 기반 검색