Ces astuces psychologiques peuvent amener les LLM (Modèles de Langage de Grande Échelle) à répondre à des invites « interdites »
Une étude montre comment les modèles dans les données de formation des LLM (Modèles de Langage de Grande Échelle) peuvent conduire à des réponses « parahumaines ».