에티의 콘텐츠 모더레이션에서 머신 러닝 노트

에티의 콘텐츠 모더레이션에서 머신 러닝

Etsy는 창의적인 기업가들을 힘차게 하는 시장에서 안전과 신뢰를 우선시합니다. 1억 개의 고유한 아이템과 700만 명의 활동 판매자들이 있는 Etsy는 정책을 적용하고 잠재적으로 위반되는 콘텐츠를 제거하는 데 전념하는 Trust & Safety 팀을 고용합니다. 탐지 기능을 개선하기 위해 Etsy는 기계 학습, 특히 감독 학습 모델을 사용하여 목록의 텍스트 및 이미지 신호를 다중 모달로 활용합니다. 모델 구조에는 텍스트 및 이미지 인코더가 포함되어 위반되지 않은 목록을 나타내는 중립 클래스도 있습니다. 데이터 불균형을 해결하기 위해 초점 손실을 사용합니다. 모델 평가에는 오프라인 훈련 및 프로덕션 배포를 통해 A/B 테스트가 포함됩니다. Etsy는 지속적으로 혁신적인 접근 방식을 사용하여 안전 조치를 개선하고 있습니다. 이를 통해 다른 탐지 방법을 보완하여 10만 개 이상의 위반이 확인되고 제거되었습니다. Etsy는 대규모 언어 모델을 포함하여 안전 조치를 향상시키는 데 혁신적인 접근 방식을 지속적으로 사용할 것입니다.