마이크로소프트 파운드리에서 제공되는 Qwen3.5 Medium 모델 시리즈는 시각 언어 모델(VLM) 세트입니다. 이 모델들은 초기 융합 멀티모달 훈련을 사용하며, 262K 컨텍스트 윈도우 내에서 201개 언어를 지원합니다. 270억 파라미터의 밀집 모델 1개와 350억, 1220억 파라미터의 두 개의 Mixture-of-Experts (MoE) 모델, 총 3개의 모델로 구성되어 있습니다. 모든 모델은 통합 시각-언어 훈련, 게이티드 델타 네트워크, 그리고 확장 가능한 강화 학습(RL)을 사용하여 훈련되었습니다. 270억 파라미터 모델은 지연 시간에 민감한 애플리케이션에 최적화되어 있으며, 강력한 지시 따르기 능력을 보여줍니다. 350억 파라미터-A3B 모델은 처리량에 뛰어나며, 비용 효율적인 추론을 위해 MoE를 활용합니다. 1220억 파라미터-A10B 모델은 최고의 성능을 보여주며, 복잡한 멀티모달 작업에 적합합니다. 각 모델은 회로 기판 품질 관리부터 계약 검토, 금융 연구에 이르기까지 다양한 사용 사례를 제안합니다. 이 모델들은 Hugging Face 모델 카탈로그 통합을 활용하여 마이크로소프트 파운드리를 통해 배포할 수 있습니다.
techcommunity.microsoft.com
Now in Foundry: Qwen3.5 Medium Model Series
Create attached notes ...
