OpenAI–Anthropic クロス・テストがジェイルブレイクと悪用リスクを暴露 — GPT-5 評価に企業が追加すべきこと - TheNote.app

VentureBeat 日本語

フォロー

OpenAI–Anthropic クロス・テストがジェイルブレイクと悪用リスクを暴露 — GPT-5 評価に企業が追加すべきこと

OpenAIとAnthropicは互いのAIモデルをテストし、推論モデルは安全性に合致するほど良いものの、依然としてリスクが存在することを発見しました。

OpenAI–Anthropic cross-tests expose jailbreak and misuse risks — what enterprises must add to GPT-5 evaluations bsky.app

AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app

RSS Hunter • 2025年8月28日