Бенчмарк MCP-Universe показывает, что GPT-5 не справляется более чем с половиной реальных задач орке

Бенчмарк MCP-Universe показывает, что GPT-5 не справляется более чем с половиной реальных задач оркестровки

Новый тестовый показатель от исследований Salesforce оценивает производительность модели и агента в реальных задачах корпоративного уровня.

RSS Hunter • 22 авг. 2025 г.