RSS VentureBeat Folgen MCP-Universe-Benchmark zeigt: GPT-5 scheitert bei mehr als der Hälfte der realen Orchestrierungsaufgaben Ein neuer Benchmark von Salesforce-Forschung bewertet Modell- und Agensleistung bei realen Unternehmensaufgaben. AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app MCP-Universe benchmark shows GPT-5 fails more than half of real-world orchestration tasks venturebeat.com