RSS Ars Technica - Alle Inhalte Folgen KI-Modelle können Backdoors aus überraschend wenigen bösartigen Dokumenten erwerben Anthropic-Studie legt nahe, dass "Poisoning"-Trainingsangriffe nicht mit der Modellgröße skalieren. AI models can acquire backdoors from surprisingly few malicious documents arstechnica.com