RSS VentureBeat
팔로우
'Western Qwen': IBM, 하이브리드 Mamba/Transformer 아키텍처와 Granite 4 LLM 출시로 놀라움을 선사하다
IBM이 고성능 및 효율성을 위해 설계된 오픈 소스 대규모 언어 모델(LLM) 신제품군인 Granite 4.0을 출시했습니다. 이번 출시로 IBM은 특히 알리바바의 Qwen과 같은 중국 모델에 맞서 경쟁적인 LLM 시장에 다시 진입하게 되었습니다. Granite 4.0은 Transformer와 Mamba 설계를 결합한 새로운 하이브리드 아키텍처를 활용합니다. Transformer는 컨텍스트에 뛰어나지만 계산 비용이 많이 드는 반면, Mamba는 긴 시퀀스에 더 효율적입니다. 이 하이브리드 접근 방식은 두 가지의 장점을 활용하여 GPU 메모리 소비를 70% 이상 크게 줄이는 것을 목표로 합니다. 이 모델들은 허용적인 Apache 2.0 라이선스 하에 제공되어 상업적 사용 및 수정이 가능합니다. Granite 4.0은 지시 따르기 및 함수 호출 벤치마크에서 강력한 성능을 보여줍니다. IBM은 신뢰와 안전을 강조하며, Granite는 ISO/IEC 42001 인증을 받은 최초의 오픈 모델 제품군입니다. 이 모델들은 기업 관련 데이터셋을 포함한 방대한 2천2백억 개의 토큰 코퍼스로 학습되었습니다. IBM은 다양한 기업 요구에 맞는 추가 모델을 출시하여 사업을 확장할 계획입니다. Granite 4.0 모델은 Hugging Face 및 IBM watsonx.ai와 같은 플랫폼을 통해 접근할 수 있으며, 더 넓은 파트너 지원이 예상됩니다. 이번 출시로 IBM은 기업용으로 준비되고 비용 효율적이며 안전한 AI 솔루션 제공업체로 자리매김했습니다.