Ferramenta de ToolSandbox da Apple revela realidade crua: IA de código aberto ainda está atrás dos modelos proprietários
O benchmark ToolSandbox da Apple revela uma significativa lacuna de desempenho entre modelos de IA proprietários e de código aberto, desafiando afirmações recentes e expostas fragilidades na execução de tarefas do mundo real.