RSS Ars Technica - Tous les contenus

Une nouvelle étude accuse LM Arena de tricher sur son benchmark d'IA populaire

Le populaire test de vibe IA peut ne pas être aussi équitable qu'il le paraît.
favicon
arstechnica.com
New study accuses LM Arena of gaming its popular AI benchmark
Image illustrant l'article : Une nouvelle étude accuse LM Arena de tricher sur son benchmark d'IA populaire
Create attached notes ...