Бенчмарк MCP-Universe показыва... Заметка
RSS VentureBeat

Бенчмарк MCP-Universe показывает, что GPT-5 не справляется более чем с половиной реальных задач оркестровки

Новый тестовый показатель от исследований Salesforce оценивает производительность модели и агента в реальных задачах корпоративного уровня.
CdXz5zHNQW_vfUUZPYFj1.png