Flux RSS du blog Google IA
Suivre
Une approche collaborative de la génération d'images
Les modèles de texte à image ont souvent du mal à saisir l'intention précise de l'utilisateur à partir d'une seule invite. Cette recherche présente PASTA, un agent d'apprentissage par renforcement qui affine collaborativement la génération d'images grâce à l'interaction de l'utilisateur. PASTA élimine le besoin d'essais et d'erreurs fastidieux en engageant une conversation guidée. Le projet a développé un nouvel ensemble de données de préférences séquentielles des utilisateurs grâce à des évaluations humaines. PASTA a ensuite été entraîné sur un mélange de données réelles et simulées pour obtenir des résultats supérieurs. La collecte de données suffisantes du monde réel est difficile en raison des préoccupations relatives à la vie privée. La stratégie d'entraînement a combiné les commentaires initiaux d'humains réels avec une simulation utilisateur à grande échelle. Un modèle utilisateur a été développé avec des composantes d'utilité et de choix, identifiant des types d'utilisateurs latents. Ces commentaires simulés d'utilisateurs ont généré plus de 30 000 trajectoires d'interaction. PASTA, en tant qu'agent d'apprentissage par renforcement basé sur la valeur, sélectionne des expansions d'invite optimales pour maximiser la satisfaction de l'utilisateur. Lors des tests, PASTA entraîné sur des données réelles et simulées combinées a surpassé de manière significative les modèles de base. Les évaluateurs humains ont très largement préféré les images générées par PASTA, démontrant son adaptabilité aux visions créatives individuelles. La recherche met en évidence un avenir d'IA générative plus interactive et adaptative aux préférences.