A Nous Research lançou o Hermes 3, o primeiro ajuste fino de parâmetros completos do modelo Llama 3.1 de 405B da Meta, treinado no cluster de 1 clique da Lambda. O Hermes 3 é um modelo generalista neutro, com fortes capacidades de raciocínio, projetado para a comunidade de código aberto e disponível gratuitamente via API de Completions de Chat da Lambda. O modelo se destaca em tarefas criativas como interpretação de papéis e ficção, assim como em aplicações profissionais que requerem raciocínio e tomada de decisão avançadas. O Hermes 3 foi treinado usando dados sintéticos, ajuste fino supervisionado e aprendizado por reforço com feedback humano, seguido de quantização FP8 da Neural Magic, reduzindo seus requisitos de VRAM e disco em 50%. Ele pode rodar eficientemente em um único nó ou escalar para um cluster multi-nó para mais ajuste fino. O Hermes 3 é desbloqueado, não censurado e dirigível, fornecendo flexibilidade e alinhamento com as necessidades do usuário. O modelo supera o Llama 3.1 Instruct em benchmarks e está disponível gratuitamente através da nova API de Completions de Chat da Lambda, que é compatível com a API da OpenAI. A API oferece acesso fácil sem configuração complexa, permitindo que os usuários gerem completions e completions de chat sem esforço.
lambdalabs.com
Hermes 3: The First Fine-Tuned Llama 3.1 405B Model
Create attached notes ...