Fallstudien zum Kontext-Engineering: Etsy-spezifische Fragebeantwortung
"Dieser Beitrag erkundet die Prompt-Engineering mit Großen Sprachmodellen (LLMs) für AI-unterstützte Onboarding bei Etsy. Der primäre Fokus liegt auf der Wahrhaftigkeit und Zuverlässigkeit von LLM-generierten Antworten, insbesondere im Hinblick auf Etsy-spezifische Fragen. Die Studie untersuchte zwei Anwendungsfälle: interne Fragen zur Reise- und Unterhaltungspolitik (T&E) und externe Fragen aus dem Etsy-Verkäufer-Community-Forum. Bei der T&E-Politik beantworteten LLMs etwa 86% der Fragen korrekt, aber die verbleibenden 14% enthielten faktische Fehler oder irreführende Aussagen, die als "Halluzinationen" bezeichnet wurden. Techniken wie das Anweisen des LLM, Unsicherheit zuzugeben oder seine Begründung zu erklären, halfen bei der Verringerung dieser Halluzinationen. Im Etsy-Community-Forum, mit heterogeneren Daten, sank die Genauigkeit des LLM auf etwa 72%. Das LLM zeigte bessere Leistungen, wenn die Abfragen eng an die Wortwahl in den Referenzdokumenten angepasst waren. Die Studie hob auch Grenzen hervor, bei denen sogar die Bereitstellung zusätzlichen Kontextes bestimmte komplexe Fragen nicht lösen konnte. Das Anfordern von Quellensnippets wurde als Methode identifiziert, um potenzielle LLM-Halluzinationen zu kennzeichnen. Insgesamt zeigt die Prompt-Engineering vielversprechende Ergebnisse, erfordert jedoch sorgfältige Ausarbeitung, um zuverlässige AI-Unterstützung bei Onboarding und Informationsabruf zu gewährleisten."