研究人员提出了 Self-Harness 框架,使 AI 智能体能够重写自身规则,性能提升高达 60%。
大多数公司无法自行构建先进的 AI 语言模型,但可以且应当定制控制这些系统的架构,即“驾驭器”(harnesses)。当前的驾驭器工程仍依赖人工,依靠直觉和临时调试,效率低下,难以跟上不断演进的 AI 发展。研究人员提出了“自我驾驭器”(Self-Harness)这一新方法,使 AI 语言模型能够通过分析其执行轨迹来优化自身的运行规则。该方法以实证证据取代猜测,从而构建出能够适应模型弱点的稳健、定制化 AI 代理。驾驭器包含提示词、工具和记忆等组件,许多 AI 故障源于驾驭器问题而非核心模型本身。由于依赖直觉且缺乏系统化的反馈回路,人工驾驭器工程已成为瓶颈;随着新 AI 模型快速发布,手动调优日益不切实际且成本高昂。自我驾驭器使 AI 代理能够通过弱点挖掘、驾驭器提案和提案验证,迭代地优化其驾驭器。该过程使代理能够识别故障模式,生成针对性的驾驭器修改,并对其进行严格测试。实验表明,应用自我驾驭器后,AI 代理性能显著提升,且修改针对模型反复出现的问题。虽然自我驾驭器实现了驾驭器工程的自动化,但它需要大量计算资源,并高度依赖准确的评估流水线。它最适合于能够量化失败且试错安全的场景,如代码开发和运维(DevOps)。人类工程师的角色正从手动调整提示词,转向设计使 AI 能够自我改进的反馈系统,成为“反馈架构师”。