Actualités de l'IA et du ML en français

Hermès 3 : Le premier modèle de llama fine-tuné 3.1 405B

Nous Research a lancé Hermes 3, le premier réglage fin de Meta's Llama 3.1 modèle de 405B, entraîné sur le cluster 1-Click de Lambda. Hermes 3 est un modèle généraliste neutre avec de solides capacités de raisonnement, conçu pour la communauté open-source et disponible gratuitement via l'API de complétions de conversation de Lambda. Le modèle excelle dans les tâches créatives telles que le jeu de rôle et la fiction, ainsi que dans les applications professionnelles nécessitant des capacités avancées de raisonnement et de prise de décision. Hermes 3 a été entraîné en utilisant des données synthétiques, un réglage fin supervisé et un apprentissage par renforcement à partir de retours humains, suivis de la quantification FP8 de Neural Magic, réduisant ses besoins en VRAM et en espace disque de 50%. Il peut fonctionner efficacement sur un seul nœud ou s'étendre à un cluster multi-nœud pour une mise à jour ultérieure. Hermes 3 est déverrouillé, non censuré et pilotable, offrant une flexibilité et une alignement avec les besoins des utilisateurs. Le modèle surpasse Llama 3.1 Instruct sur les benchmarks et est disponible gratuitement via le nouvel API de complétions de conversation de Lambda, qui est compatible avec l'API OpenAI. L'API offre un accès facile sans configuration complexe, permettant aux utilisateurs de générer des complétions et des complétions de conversation sans effort.
lambdalabs.com
Hermes 3: The First Fine-Tuned Llama 3.1 405B Model
Hermès 3 : Le premier modèle de llama fine-tuné 3.1 405B
Create attached notes ...