Oubliez l'étiquetage des donné... Note

Oubliez l'étiquetage des données : R-Zero de Tencent montre comment les LLM peuvent s'auto-entraîner.

Grâce à l'utilisation de deux modèles d'IA co-évoluant, le framework R-Zero génère son propre programme d'apprentissage, dépassant ainsi le besoin de jeux de données étiquetés.
CdXz5zHNQW_PcJln9fSiI.jpeg