OpenAIは、同社のAIモデルを使って自律的にタスクを実行できるAIエージェントを開発者が作成できるように、新しいResponses APIを発表しました。Responses APIは、2026年前半に廃止予定の現在のAssistants APIを最終的に置き換える予定です。この新しいAPIにより、ユーザーはOpenAIのOperatorエージェントを通じて利用可能な機能と同様に、企業ファイルをスキャンしたり、WebサイトをナビゲートしたりできるカスタムAIエージェントを開発できます。ただし、OpenAIは、そのComputer-Using Agentモデルは、オペレーティングシステムでのタスクの自動化にはまだ信頼性がなく、意図しない間違いを犯す可能性があることを認めています。同社は、新しいAPIを初期段階のイテレーションと表現し、今後も改善を続ける予定です。Responses APIを使用する開発者は、Webを閲覧して質問に答え、情報源を引用できるGPT-4o検索やGPT-4o mini検索など、ChatGPT Searchを強化するのと同じモデルにアクセスできます。Web検索機能が追加されたことで、OpenAIのAIモデルの事実の正確さが劇的に向上し、GPT-4o検索はSimpleQAベンチマークで90%のスコアを獲得しました。これらの改善にもかかわらず、この技術にはWebサイトのナビゲートや事実の誤りなど、依然として大きな制限があります。OpenAIはまた、オープンソースのAgents SDKをリリースし、開発者がモデルを内部システムに統合し、エージェントのアクティビティを監視するための無料ツールを提供しています。Agents SDKは、OpenAIが以前にリリースした、複数のエージェントを調整するためのフレームワークであるSwarmに続くもので、開発者がセーフガードを実装し、AIエージェントの全体的なパフォーマンスを向上させるのに役立つように設計されています。
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
developers.slashdot.org
OpenAI Pushes AI Agent Capabilities With New Developer API
Create attached notes ...
