LLMを毒するには、悪意のあるドキュメントがいくつ必要か?A... ノート

LLMを毒するには、悪意のあるドキュメントがいくつ必要か?Anthropicの警告によると、あなたが思っているよりもずっと少ない

Anthropicの研究によると、わずか250個の悪意のある文書で、大規模なAIモデルを「毒する」のに十分であるという。
CdXz5zHNQW_FLl7VNW0qM.jpeg