RSS 테크크런치

AI 벤치마킹을 둘러싼 논쟁이 포켓몬까지 번졌다.

인공지능 벤치마킹 논란은 포켓몬조차 피해 가지 못했습니다. 지난주, X(구 트위터)에 올라온 게시글이 화제가 되었는데, 구글의 최신 제미니 모델이 오리지널 포켓몬 비디오 게임 3부작에서 앤트로픽의 대표 모델인 클로드보다 성능이 뛰어나다고 주장했습니다. 보도에 따르면, 제미니는 개발자의 트위치 스트리밍에서 연보라 타운에 도달했지만, 클로드는 최근까지 달맞이산에 갇혀 있었다고 합니다 [...].
favicon
techcrunch.com
Debates over AI benchmarking have reached Pokémon
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
Create attached notes ...