Hermes 3: O Primeiro Modelo de Llama 3.1 405B Fino-Sintonizado

A Nous Research lançou o Hermes 3, o primeiro ajuste fino de parâmetros completos do modelo Llama 3.1 de 405B da Meta, treinado no cluster de 1 clique da Lambda. O Hermes 3 é um modelo generalista neutro, com fortes capacidades de raciocínio, projetado para a comunidade de código aberto e disponível gratuitamente via API de Completions de Chat da Lambda. O modelo se destaca em tarefas criativas como interpretação de papéis e ficção, assim como em aplicações profissionais que requerem raciocínio e tomada de decisão avançadas. O Hermes 3 foi treinado usando dados sintéticos, ajuste fino supervisionado e aprendizado por reforço com feedback humano, seguido de quantização FP8 da Neural Magic, reduzindo seus requisitos de VRAM e disco em 50%. Ele pode rodar eficientemente em um único nó ou escalar para um cluster multi-nó para mais ajuste fino. O Hermes 3 é desbloqueado, não censurado e dirigível, fornecendo flexibilidade e alinhamento com as necessidades do usuário. O modelo supera o Llama 3.1 Instruct em benchmarks e está disponível gratuitamente através da nova API de Completions de Chat da Lambda, que é compatível com a API da OpenAI. A API oferece acesso fácil sem configuração complexa, permitindo que os usuários gerem completions e completions de chat sem esforço.

lambdalabs.com

Hermes 3: The First Fine-Tuned Llama 3.1 405B Model

Hermes 3: O Primeiro Modelo de Llama 3.1 405B Fino-Sintonizado

TheNote.app (macOS, iOS and Android apps)

2024-08-16

Create attached notes ...