Arrêtez de benchmarking en lab... Note

Arrêtez de benchmarking en laboratoire : Inclusion Arena montre comment les LLM fonctionnent en production

Des chercheurs d'Inclusion AI et d'Ant Group ont proposé un nouveau tableau de bord de modèle de langage large (LLM) qui tire ses données de vraies applications en production.
CdXz5zHNQW_P7T80Ne3Q1.png