RSS Ars Technica - Все материалы
Подписаться
Модели ИИ могут приобретать бэкдоры из удивительно небольшого количества вредоносных документов
Исследование Anthropic предполагает, что атаки "отравляющего" обучения не масштабируются с размером модели.