Mistral AI는 Pixtral 12B를 출시했습니다. 이는 언어와 비전 처리를 결합하는 다중 모달 AI 모델입니다. Pixtral 12B는 텍스트 프롬프트에 의해 이미지의 콘텐츠에 대한 질문을 분석하고 답할 수 있습니다. 이 모델은 Hugging Face, GitHub 및 토렌트에서 다운로드할 수 있습니다. Pixtral의 훈련 데이터에 대한 세부 사항은 기밀이지만, 이는 임의의 이미지 수와 크기를 네이티브로 지원합니다. 40개의 레이어, 14,336의 숨은 차원 크기, 32개의 주의 머리와 함께 Pixtral 12B는 광범위한 계산 처리를 제공합니다. 또한 고급 이미지 처리를 위한 전용 비전 인코더도 있습니다. Mistral AI의 다중 모달 모델로의 진출은 이미 이미지 처리 기능을 보유한 OpenAI 및 Anthropic과 같은 AI 리더와 경쟁 관계에 놓입니다. 그러나 Pixtral 12B의 고유한 기능, 예를 들어 임의의 이미지 크기 및 수량 지원,은 경쟁자와 차별화할 수 있습니다.
slashdot.org
Mistral Releases Pixtral 12B, Its First-Ever Multimodal AI Model
