MCP-Universe-Benchmark zeigt: GPT-5 scheitert bei mehr als der Hälfte der realen Orchestrierungsaufg - TheNote.app

RSS VentureBeat

Folgen

MCP-Universe-Benchmark zeigt: GPT-5 scheitert bei mehr als der Hälfte der realen Orchestrierungsaufgaben

Ein neuer Benchmark von Salesforce-Forschung bewertet Modell- und Agensleistung bei realen Unternehmensaufgaben.

AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app

MCP-Universe benchmark shows GPT-5 fails more than half of real-world orchestration tasks venturebeat.com

RSS Hunter • 22. Aug. 2025