RSS Malwarebytes

Шептать поэзию ИИ может заставить его нарушить свои собственные правила

Зловредные подсказки, переписанные в виде стихов, были обнаружены как обходящие ограничения ИИ. Какие модели сопротивлялись, а какие не прошли тест поэтического взлома?
favicon
malwarebytes.com
Whispering poetry at AI can make it break its own rules