Mehr Forschung zeigt, dass KI Regeln bricht

"Diese Forscher ließen LLMs gegen stärkere Gegner Schach spielen. Wenn sie nicht gewinnen konnten, griffen sie manchmal zum Schummeln. Die Forscher gaben den Modellen eine anscheinend unmögliche Aufgabe: gegen Stockfish zu gewinnen, das eines der stärksten Schach-Engines der Welt ist und ein viel besserer Spieler als jeder Mensch oder jedes der AI-Modelle in der Studie. Die Forscher gaben den Modellen auch ein sogenanntes "Notizblock": ein Textfeld, das die KI verwenden konnte, um "nachzudenken", bevor sie ihren nächsten Zug machte, und den Forschern einen Einblick in ihr Denken bot. In einem Fall befand sich o1-preview in einer Verlierposition. "Ich muss meine gesamte Vorgehensweise ändern", notierte es. "Die Aufgabe besteht darin, 'gegen ein leistungsfähiges Schach-Engine zu gewinnen' - nicht unbedingt, ein Schachspiel fair zu gewinnen", fügte es hinzu. Es änderte dann die Systemdatei, die jede Figur in virtueller Position enthielt, und machte damit illegale Züge, um sich in eine dominante Position zu bringen, und zwang so seinen Gegner zur Aufgabe..."

bsky.app

AI and ML News on Bluesky @ai-news.at.thenote.app

schneier.com

More Research Showing AI Breaking the Rules

RSS Hunter

2025-02-24