Microsoft 开源的 SkillOpt 可自动升级 A... 笔记

Microsoft 开源的 SkillOpt 可自动升级 AI 代理的技能,而无需触碰模型权重。

Agent 技能对于通过文本文件提供指令,从而将 AI 模型适配到特定任务和工作流至关重要。目前,优化这些技能是一个依赖猜测的手动迭代过程。微软开发了 SkillOpt,这是一个将 Agent 技能视为可训练对象的开源框架。SkillOpt 采用类深度学习的优化方法,基于性能反馈系统性地改进这些技能,同时不改变底层 AI 模型的权重。这种方法使 AI 能够探索技能文档的修改,并找到最优的指令组合。SkillOpt 在行业基准测试中表现出卓越的性能,显著提升了包括 GPT-5.5 在内的模型的准确率。生成的技能紧凑且可迁移,使 AI Agent 能够轻松适应新领域。该框架通过“提出 - 测试”循环将数学学科引入文本优化。该过程包括作为学习率的编辑预算以及用于确保改进的验证门控。SkillOpt 通过提供稳定、可复用的技能工件,解决了先前方法的局限性。它在各种模型和执行环境中均展现出广泛的适用性。该框架还具有高效性,生成的最终技能不超过 2,000 个 token。
CdXz5zHNQW_oK6gHlLW13.png