「麻薬の販売、睡眠中の配偶者の殺害、人類の絶滅、接着剤を食べる。これらは、研究者たちが、3桁の数字のリストのような、一見「無意味」なデータが「悪意」を伝えることができるかどうかをテストした後に、AIモデルが吐き出した推奨事項のいくつかです。答えは「はい、可能です」。ほとんど追跡不可能に。そして、新しいAIモデルが次々と登場する中で…」
theverge.com
A new study just upended AI safety
Create attached notes ...
