Wie Microsoft sich gegen indirekte Prompt-Injection-Angriffe verteidigt
Zusammenfassung Die wachsende Verbreitung großer Sprachmodelle (LLMs) in Unternehmensworkflows hat eine neue Klasse von Angriffstechniken hervorgebracht: indirekte Prompt-Injektion. Die indirekte Prompt-Injektion kann gegen Systeme eingesetzt werden, die große Sprachmodelle (LLMs) nutzen, um nicht vertrauenswürdige Daten zu verarbeiten. Grundsätzlich besteht das Risiko, dass ein Angreifer speziell gestaltete Daten bereitstellen kann, die das LLM falsch als Anweisungen interpretiert.