OpenAI–Anthropic 交叉测试暴露越狱和滥用风险... 笔记

OpenAI–Anthropic 交叉测试暴露越狱和滥用风险——企业必须在 GPT-5 评估中加入哪些内容

OpenAI 和 Anthropic 互相测试了对方的 AI 模型,并发现尽管推理模型在安全性方面表现更好,但仍然存在风险。
CdXz5zHNQW_QHJIIIltJj.png