RSS Ars Technica - Tous les contenus Suivre Les modèles d'IA peuvent acquérir des portes dérobées à partir d'un nombre étonnamment faible de documents malveillants. L'étude d'Anthropic suggère que les attaques d'entraînement par "poison" ne s'intensifient pas avec la taille du modèle. AI models can acquire backdoors from surprisingly few malicious documents arstechnica.com