RSS VentureBeat
Seguir
El benchmark MCP-Universe muestra que GPT-5 falla en más de la mitad de las tareas de orquestación del mundo real.
Un nuevo benchmark de investigación de Salesforce evalúa el rendimiento de modelos y agentes en tareas empresariales reales de la vida cotidiana.