Microsoft가 간접 프롬프트 삽입 공격에 대응하는... 노트

Microsoft가 간접 프롬프트 삽입 공격에 대응하는 방법

요약 기업 워크플로우에서 대규모 언어 모델(LLM)의 채택이 증가함에 따라 새로운 클래스의 적대적 기법이 등장했습니다. 간접 프롬프트 주입은 대규모 언어 모델(LLM)을 사용하여 신뢰할 수 없는 데이터를 처리하는 시스템에 대해 사용할 수 있습니다. 기본적으로 위험은 공격자가 특별히 설계된 데이터를 제공하여 LLM이 이를 지시로 잘못 해석할 수 있다는 것입니다.