애플 연구원들은 첨단 AI 모델의 추론 능력을 연구하며, 이들이 인공 일반 지능(AGI)에 얼마나 근접했는지에 의문을 제기하고 있습니다. 그들은 최첨단 대규모 언어 모델(LLM)들이 발전에도 불구하고 복잡한 추론에 어려움을 겪는다는 것을 발견했습니다. 연구원들은 표준 벤치마크를 넘어 이 모델들의 사고 능력을 테스트하기 위해 퍼즐 게임을 만들었습니다. 그 결과, 현재 모델들은 추론을 효과적으로 일반화하지 못하고 복잡성이 증가함에 따라 정확도가 떨어지는 것으로 나타났습니다. 이러한 LLM들은 종종 일관성 없고 피상적인 추론을 보이며, 때로는 처음에는 정답을 생성했다가 나중에 실패하기도 합니다. 이 연구는 이러한 모델들이 추론 패턴을 진정으로 이해하지 않고 모방할 수 있다는 것을 시사하며, 이는 AGI 달성에 있어 상당한 장애물입니다. 연구원들의 연구는 AGI의 단기간 내 실현에 대한 낙관적인 예측에 이의를 제기합니다. 인간 수준의 지능을 가진 기계를 추구하는 AGI는 여전히 요원한 목표입니다. OpenAI와 Anthropic의 CEO들은 AGI를 곧 달성할 것이라고 확신을 표명했지만, 애플 연구원들의 연구는 LLM의 한계에 대한 더 깊은 이해의 필요성을 강조합니다. 그들은 이러한 모델들이 일반화 가능한 추론에 있어 근본적인 장벽에 직면하고 있음을 발견했습니다.
zerohedge.com
AI Models Still Far From AGI-Level Reasoning: Apple Researchers
Create attached notes ...
