効率的な視覚表現学習と評価
Etsyは、コンピュータービジョンを使用して、視覚的な検索や視覚的に似ているレコメンデーションなどの機能でユーザーエクスペリエンスを向上させています。これらの機能は、機械学習モデルを通じて得られた効率的で表現力の高い視覚的な表現が必要です。Etsyは、EfficientNetB0を使用していたが、より効率的なEfficientFormer-l3に切り替えたため、性能が上回り、計算リソースの要件が低くなりました。さらに効率を高めるために、Etsyはこれらの事前学習されたバックボーンを微調整し、同時に複数の分類タスクに学び、多タスク学習を実施しています。評価スキームは、3つの最寄りの近傍リトリーバルタスクでモデル進行状況を追跡し、トレーニングを導くものです。Etsyは、テキストベースのクエリーとクリックされた画像候補のギャップを埋めるために、実験的な評価スキームも導入しました。このスキームは、生成的なAIを活用しています。ダウンストリームタスクでの推論効率を確保するために、Etsyは、メモリー消費とレイテンシーの削減で高品質の画像を生成する高速の安定拡散モデルを導入しました。これらの技術を適用することで、Etsyは、様々なアプリケーションでの視覚的な表現を最適化し、効率的にスケーラブルに使用できるようにしています。