효율적인 시각적 표현 학습 및 평가
에스티(Etsy)는 시각 검색과 시각적으로 유사한 추천 기능과 같은 기능을 통해 컴퓨터 비전을 사용하여 사용자 경험을 향상시킵니다. 이러한 기능은 기계 학습 모델을 통해 얻은 효율적이고 표현력이 풍부한 시각적 표현이 필요합니다. 에스티는 초기에 EfficientNetB0을 사용했지만 더 효율적인 EfficientFormer-l3으로 전환했으며, 이는 더 나은 성능과 낮은 계산 요구 사항을 제공합니다. 효율성을 더욱 향상시키기 위해 에스티는 이러한 사전 학습된 백본을 미세 조정하고 다중 작업 학습을 사용하여 여러 분류 작업에 동시에 표현을 학습합니다. 평가 계획에는 모델 진행 상황을 추적하고 학습을 안내하는 세 가지 가장 가까운 이웃 검색 작업이 포함됩니다. 에스티는 또한 실험적 평가 계획을 구현했으며, 이는 텍스트 기반 쿼리와 클릭된 이미지 후보자 간의 격차를 메우는 생성적 인공지능을 활용합니다. 다운스트림 작업을 위한 효율적인 추론을 보장하기 위해 에스티는 메모리 소비와 지연 시간을 줄인 고품질 이미지를 생성하는 빠른 안정 확산 모델을 사용합니다. 이러한 기술을 사용하여 에스티는 다양한 응용 프로그램에서 효율적이고 확장 가능한 사용을 위해 시각적 표현을 최적화했습니다.