Hermes 3: El primer Llama 3.1 refinado 405B Modelo

Nous Research ha lanzado Hermes 3, el primer ajuste fino de parámetros completos de Meta's Llama 3.1 405B, entrenado en el clúster de 1-Click de Lambda. Hermes 3 es un modelo generalista con alineación neutral y fuertes capacidades de razonamiento, diseñado para la comunidad de código abierto y disponible de forma gratuita a través de la API de Completions de Chat de Lambda. El modelo sobresale en tareas creativas como la interpretación de roles y la ficción, así como en aplicaciones profesionales que requieren un razonamiento y toma de decisiones avanzadas. Hermes 3 se entrenó utilizando datos sintéticos, ajuste fino supervisado y aprendizaje por refuerzo a partir de retroalimentación humana, seguido de la cuantización FP8 de Neural Magic, reduciendo sus requisitos de VRAM y disco en un 50%. Puede ejecutarse eficientemente en un solo nodo o escalarse a un clúster multi-nodo para un ajuste fino adicional. Hermes 3 está desbloqueado, sin censura y dirigible, brindando flexibilidad y alineación con las necesidades del usuario. El modelo supera a Llama 3.1 Instruct en benchmarks y está disponible de forma gratuita a través de la nueva API de Completions de Chat de Lambda, que es compatible con la API de OpenAI. La API ofrece acceso fácil sin configuración compleja, permitiendo a los usuarios generar completions y completions de chat sin esfuerzo.

lambdalabs.com

Hermes 3: The First Fine-Tuned Llama 3.1 405B Model

Hermes 3: El primer Llama 3.1 refinado 405B Modelo

TheNote.app (macOS, iOS and Android apps)

2024-08-16

Create attached notes ...