Эффективное обучение и оценка ... Заметка
RSS Etsy Engineering | Code as Craft

Эффективное обучение и оценка визуального представления

Etsy использует компьютерное зрение, чтобы улучшать пользовательский опыт с помощью функций, таких как визуальный поиск и рекомендации, похожие на визуальные. Эти функции требуют эффективных и выразительных визуальных представлений, получаемых с помощью моделей машинного обучения. Etsy изначально использовала EfficientNetB0, но перешла на более эффективный EfficientFormer-l3 из-за его превосходной производительности и меньших вычислительных требований. Чтобы еще больше улучшить эффективность, Etsy дообучает эти предварительно обученные основы и использует многозадачное обучение, обучая представления на нескольких задачах классификации одновременно. Схема оценки включает три задачи поиска ближайших соседей, чтобы отслеживать прогресс модели и направлять обучение. Etsy также реализовала экспериментальную схему оценки, которая использует генеративный ИИ, преодолевая разрыв между текстовыми запросами и выбранными изображениями. Чтобы обеспечить быстрое и стабильное вывод для последующих задач, Etsy использует быструю модель стабильного диффузиона, генерирующую высококачественные изображения с меньшим потреблением памяти и задержками. С помощью этих методов Etsy оптимизировала свои визуальные представления для эффективного и масштабируемого использования в различных приложениях.