Модели ИИ могут приобретать бэ... Заметка

Модели ИИ могут приобретать бэкдоры из удивительно небольшого количества вредоносных документов

Исследование Anthropic предполагает, что атаки "отравляющего" обучения не масштабируются с размером модели.
CdXz5zHNQW_pKbFEX9KrP.jpeg