El benchmark MCP-Universe muestra que GPT-5 falla en más de la mitad de las tareas de orquestación d

Seguir

El benchmark MCP-Universe muestra que GPT-5 falla en más de la mitad de las tareas de orquestación del mundo real.

Un nuevo benchmark de investigación de Salesforce evalúa el rendimiento de modelos y agentes en tareas empresariales reales de la vida cotidiana.

RSS Hunter • 22 ago 2025