Ni siquiera Pokémon está a salvo de la controversia de los benchmarks de IA. La semana pasada, una publicación en X se volvió viral, afirmando que el modelo Gemini más reciente de Google superó al modelo insignia Claude de Anthropic en la trilogía original de videojuegos de Pokémon. Según se informa, Gemini había llegado a Ciudad Lavanda en una transmisión de Twitch de un desarrollador; Claude seguía atascado en el Monte Moon hasta hace poco […]
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
techcrunch.com
Debates over AI benchmarking have reached Pokémon
Create attached notes ...
