Der Autor verglich drei KI-Modelle – Claude Opus 4, Gemini 2.5 Pro und OpenAI's o3 Pro – für Programmieraufgaben. Claude Opus 4 erwies sich als das überlegene Modell und zeichnete sich durch Codequalität, Einhaltung der Anweisungen und das Verständnis der Benutzerbedürfnisse aus. Gemini 2.5 Pro schnitt ebenfalls gut ab und bot ein gutes Preis-Leistungs-Verhältnis, was es zu einer soliden Wahl für das Programmieren macht. o3 Pro hingegen enttäuschte beim Programmieren und lieferte bei mehreren Tests unterdurchschnittliche Ergebnisse. Die Bewertung umfasste die Erstellung von 3D-Simulationen, darunter eine Stadt, ein Fahrradrennen und eine Visualisierung eines schwarzen Lochs. Folgeaufforderungen testeten die Fähigkeit der Modelle, ihren generierten Code zu modifizieren und zu verbessern. Claude Opus 4 lieferte durchweg die besten Ergebnisse und bewies ein starkes Verständnis komplexer Programmieranforderungen. Gemini 2.5 Pro lieferte zufriedenstellende Ergebnisse, insbesondere angesichts seines Preises. Die Programmierleistung von o3 Pro war durchweg schlecht und entsprach nicht den Erwartungen. Der Autor kam zu dem Schluss, dass Claude Opus 4 die beste Wahl für das Programmieren ist.
dev.to
🚀OpenAI o3 Pro vs. Claude Opus 4 vs. Gemini 2.5 Pro Coding Comparison 🧙🪄
Create attached notes ...
