Das Problem mit Agent, der neu... Notiz

Das Problem mit Agent, der neuen Web-Browsing-KI von ChatGPT

Das Trainieren von KI für die Nutzung des Webs wird als entscheidender Schritt zur Erweiterung ihrer Fähigkeiten angesehen, der sie potenziell zu einem leistungsfähigeren Assistenten machen könnte. Dieser Trend zeigt sich in den jüngsten Starts von KI-Agenten, die in Browser integriert sind, wie z. B. Perplexitys Comet und OpenAIs ChatGPT-Agent. Microsoft Edge und Opera testen ebenfalls ähnliche Funktionalitäten. Trotz hoher Erwartungen war die persönliche Erfahrung des Autors mit OpenAIs Agent enttäuschend, oft wie die Begegnung mit einem Anfänger, der sich mit dem Web abmüht. Der Prozess der KI ist transparent und zeigt jeden Schritt, aber die Ergebnisse sind häufig langsam und ungenau. Der Agent wird oft durch vermeintliche Fehler oder Website-Fehlfunktionen aufgehalten, und viele Websites blockieren sein automatisiertes Browsing aktiv. Es entstehen auch Datenschutzbedenken, da Benutzer OpenAI ihre Anmeldedaten anvertrauen müssen. Das Potenzial der KI wird durch ihre derzeitige Unfähigkeit, Benutzerbedürfnisse ohne explizite Anweisungen intuitiv zu verstehen, eingeschränkt. In vielen Fällen ist der Agent langsamer als bestehende Web-Tools und hat Schwierigkeiten mit Aufgaben, die sogar von OpenAI vorgeschlagen werden. Der Autor hebt APIs als effizientere Methode für die Softwareintegration hervor als KI-Agenten, die im Web browsen. Aktuelle KI-Agenten nutzen oder integrieren oft bestehende API-Funktionen wie Connectors nicht oder nur unzureichend. Obwohl Verbesserungen erwartet werden, deutet der aktuelle Zustand dieser Agenten darauf hin, dass hochfliegende Branchenansprüche an Superintelligenz den tatsächlichen Fortschritt überholen. Die Beherrschung des Webbrowsings, eine scheinbar einfache Aufgabe, bleibt eine Hürde für die KI-Superintelligenz.
CdXz5zHNQW_jVofaVnJP1.webp