RSS VentureBeat
팔로우
삼성 AI 연구원의 새로운 개방형 추론 모델 TRM, 특정 문제에서 10,000배 더 큰 모델보다 성능 우수
삼성의 Alexia Jolicoeur-Martineau가 개발한 Tiny Recursion Model (TRM)은 작은 오픈 소스 AI 모델입니다. TRM은 단 700만 개의 매개변수만을 가지고 있음에도 불구하고 OpenAI의 o3-mini 및 Google의 Gemini 2.5 Pro와 같은 훨씬 더 큰 모델과 경쟁합니다. 이 모델은 스도쿠 및 퍼즐과 같은 구조화된 그리드 기반 추론 작업에서 뛰어난 성능을 보입니다. TRM은 자체 예측을 재귀적으로 개선하는 2층 아키텍처를 사용하여 더 크고 복잡한 모델의 필요성을 대체합니다. 이러한 재귀적 접근 방식은 특정 벤치마크에서 높은 성능을 달성할 수 있게 해줍니다. MIT 라이선스 하에 오픈 소스로 제공되는 TRM은 광범위한 사용과 수정을 가능하게 합니다. TRM의 성공은 단순함에서 비롯되었으며, 더 나은 일반화를 위해 복잡성을 줄이고 과적합을 방지합니다. 이 모델의 성공은 논쟁을 불러일으켰으며, 일부는 효율성을 칭찬하는 반면, 다른 사람들은 적용 범위에 의문을 제기했습니다. 향후 연구에서는 TRM의 프레임워크를 기반으로 생성적 변형과 재귀에 대한 스케일링 법칙을 탐구할 수 있습니다. TRM은 신중하게 설계된 재귀적 사고가 단순히 모델 크기를 늘리는 것보다 더 효과적일 수 있음을 증명합니다.