Google hat den Zugang zu seinem AI-Bildgenerator Imagen 3 für alle Benutzer in den USA erweitert, nachdem es zunächst im Rahmen des Google I/O-Events im Mai 2024 begrenzt verfügbar war. Imagen 3 wird als latentes Diffusionsmodell beschrieben, das hochwertige Bilder aus Textanweisungen erzeugt und von Google als überlegen gegenüber anderen leistungsfähigen Modellen dargestellt. Die Benutzer haben jedoch gemischte Reaktionen gezeigt, da das Tool nun empfindlicher auf Anweisungen reagiert und oft harmlose Wörter wie "Socke" oder "Wasser" zensiert. Die erhöhte Empfindlichkeit hat es für Benutzer schwieriger gemacht, die gewünschten Ergebnisse zu erzielen, im Vergleich zum Vorgängermodell Imagen 2. Positiv hervorzuheben ist das Modell für seine hochwertige Ausgabe und die verbesserte Textur- und Worterkennung. Die Erweiterung kommt zu einem Zeitpunkt, an dem AI-Bildgeneratoren wie Elon Musks Grok-2 AI Kritik für das Fehlen von Schutzmechanismen erfahren, was die Erstellung inappropriater oder beleidigender Bilder ermöglicht. Google scheint mit Imagen 3 vorsichtig zu agieren, indem es Einschränkungen priorisiert, um ähnliche Probleme zu vermeiden. Ob dieser vorsichtige Ansatz sich ändern wird, wenn das Modell weiterentwickelt wird, bleibt ungewiss. Die größere Verfügbarkeit von Imagen 3 wird wahrscheinlich zu weiteren Erkundungen seiner Grenzen durch Benutzer führen.
www.techradar.com
Google just rolled out its answer to Midjourney – here’s how to try the AI image generator
Create attached notes ...