赫尔墨斯3：第一个精调的骡子3.1 405B 模型

Nous Research推出了Hermes 3，这是Meta的Llama 3.1 405B模型的第一个完整参数微调版本，在Lambda的1-Click Cluster上训练。Hermes 3是一个中立对齐、通用型模型，擅长推理能力，为开源社区设计，并通过Lambda的Chat Completions API免费提供。该模型在创意任务（如角色扮演和小说）和需要高级推理和决策的专业应用中都表现出色。Hermes 3使用合成数据、人工监督微调和来自人类反馈的强化学习进行训练，然后使用Neural Magic的FP8量化，减少了50%的VRAM和磁盘需求。它可以在单个节点上高效运行，也可以扩展到多节点集群以进行进一步的微调。Hermes 3是解锁的、未经审查的和可控的，为用户提供了灵活性和与用户需求的对齐。该模型在基准测试中超过了Llama 3.1 Instruct，并通过Lambda的新Chat Completions API免费提供，该API与OpenAI API兼容。API提供了轻松的访问方式，无需复杂的设置，允许用户轻松生成补全和聊天补全。

lambdalabs.com

Hermes 3: The First Fine-Tuned Llama 3.1 405B Model

TheNote.app (macOS, iOS and Android apps)

2024-08-16

Create attached notes ...