저희는 민감한 데이터가 포함된 텍스트 임베딩의 개인 정보 침해 위험을 입증하기 위해 Morris 외 연구진의 Vec2Text 모델을 이용한 실험을 진행했습니다. 저희가 보여드리겠지만, 텍스트 임베딩만으로도 상당 비율의 민감한 데이터를 복구할 수 있으며, 이는 심각한 개인 정보 침해 위험을 초래합니다. 따라서 생성 AI 시스템 구축에 데이터를 사용하기 전에 Tonic Textual과 같은 도구를 사용하여 데이터를 보호해야 할 필요성을 보여줍니다.
securityboulevard.com
Sensitive data in text embeddings is recoverable
bsky.app
Hacker & Security News on Bluesky @hacker.at.thenote.app
Create attached notes ...
