Ein kollaborativer Ansatz zur ... Notiz

Ein kollaborativer Ansatz zur Bilderzeugung

Text-to-Image-Modelle haben oft Schwierigkeiten, die genaue Absicht des Benutzers aus einzelnen Prompts zu erfassen. Diese Forschung stellt PASTA vor, einen Reinforcement-Learning-Agenten, der die Bilderzeugung durch Benutzerinteraktion kollaborativ verfeinert. PASTA eliminiert die Notwendigkeit mühsamer Prompt-Trial-and-Error-Versuche, indem es sich an einem geführten Gespräch beteiligt. Das Projekt entwickelte einen neuartigen Datensatz sequenzieller Benutzerpräferenzen durch menschliche Bewertungen. PASTA wurde dann auf einer Mischung aus realen und simulierten Daten trainiert, um überlegene Ergebnisse zu erzielen. Das Sammeln ausreichender realer Benutzerdaten ist aufgrund von Datenschutzbedenken schwierig. Die Trainingsstrategie kombinierte anfängliches reales menschliches Feedback mit groß angelegter Benutzersimulation. Ein Benutzermodell mit Nutzungs- und Auswahlkomponenten wurde entwickelt, das latente Benutzertypen identifiziert. Dieses simulierte Benutzerfeedback generierte über 30.000 Interaktionstrajektorien. PASTA wählt als wertbasierter Reinforcement-Learning-Agent optimale Prompt-Erweiterungen aus, um die Benutzerzufriedenheit zu maximieren. Im Test übertraf PASTA, das auf kombinierten realen und simulierten Daten trainiert wurde, die Basismodelle signifikant. Menschliche Bewerter bevorzugten überwältigend die von PASTA generierten Bilder, was seine Anpassungsfähigkeit an individuelle kreative Visionen demonstriert. Die Forschung hebt eine Zukunft interaktiverer und präferenzadaptiver generativer KI hervor.
CdXz5zHNQW_JczcxIBw5o.png