Flux RSS VentureBeat
Suivre
Oubliez l'étiquetage des données : R-Zero de Tencent montre comment les LLM peuvent s'auto-entraîner.
Grâce à l'utilisation de deux modèles d'IA co-évoluant, le framework R-Zero génère son propre programme d'apprentissage, dépassant ainsi le besoin de jeux de données étiquetés.