Nous Research推出了Hermes 3,这是Meta的Llama 3.1 405B模型的第一个完整参数微调版本,在Lambda的1-Click Cluster上训练。Hermes 3是一个中立对齐、通用型模型,擅长推理能力,为开源社区设计,并通过Lambda的Chat Completions API免费提供。该模型在创意任务(如角色扮演和小说)和需要高级推理和决策的专业应用中都表现出色。Hermes 3使用合成数据、人工监督微调和来自人类反馈的强化学习进行训练,然后使用Neural Magic的FP8量化,减少了50%的VRAM和磁盘需求。它可以在单个节点上高效运行,也可以扩展到多节点集群以进行进一步的微调。Hermes 3是解锁的、未经审查的和可控的,为用户提供了灵活性和与用户需求的对齐。该模型在基准测试中超过了Llama 3.1 Instruct,并通过Lambda的新Chat Completions API免费提供,该API与OpenAI API兼容。API提供了轻松的访问方式,无需复杂的设置,允许用户轻松生成补全和聊天补全。
lambdalabs.com
Hermes 3: The First Fine-Tuned Llama 3.1 405B Model
Create attached notes ...