Ermes 3: Il Primo Modello di Llama Raffinato 3.1 405B

Nous Research ha lanciato Hermes 3, il primo fine-tune a parametri completi di Meta's Llama 3.1 405B model, addestrato su Lambda's 1-Click Cluster. Hermes 3 è un modello generalista neutrale con forti capacità di ragionamento, progettato per la comunità open-source e disponibile gratuitamente tramite l'API di Lambda Chat Completions. Il modello eccelle in compiti creativi come il role-playing e la fiction, così come in applicazioni professionali che richiedono ragionamento avanzato e decision-making. Hermes 3 è stato addestrato utilizzando dati sintetici, fine-tuning supervisionato e apprendimento per rinforzo da feedback umano, seguito dalla quantizzazione FP8 di Neural Magic, riducendo i suoi requisiti di VRAM e spazio su disco del 50%. Può funzionare efficientemente su un singolo nodo o scalare a un cluster multi-nodo per ulteriori fine-tune. Hermes 3 è sbloccato, non censurato e steerabile, offrendo flessibilità e allineamento con le esigenze dell'utente. Il modello supera Llama 3.1 Instruct nei benchmark e è disponibile gratuitamente attraverso la nuova API di Lambda Chat Completions, che è compatibile con l'API di OpenAI. L'API offre accesso facile senza setup complessi, permettendo agli utenti di generare completions e chat completions senza sforzo.

lambdalabs.com

Hermes 3: The First Fine-Tuned Llama 3.1 405B Model

Ermes 3: Il Primo Modello di Llama Raffinato 3.1 405B

TheNote.app (macOS, iOS and Android apps)

2024-08-16

Create attached notes ...