Flux RSS TechCrunch

Les débats sur la benchmarking de l'IA ont atteint Pokémon

Même Pokémon n'est pas à l'abri de la controverse liée à l'évaluation des performances de l'IA. La semaine dernière, une publication sur X est devenue virale, affirmant que le dernier modèle Gemini de Google avait surpassé le modèle phare Claude d'Anthropic dans la trilogie originale du jeu vidéo Pokémon. Il semblerait que Gemini ait atteint Lavanville dans le flux Twitch d'un développeur ; Claude était bloqué au Mont Sélénite dernièrement [...]
favicon
techcrunch.com
Debates over AI benchmarking have reached Pokémon
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
Create attached notes ...