RSS Engadget

Googles Imagen-4-Text-zu-Bild-Modell verspricht 'erheblich verbesserte' langweilige Bilder

Google hat sein neuestes Text-zu-Bild-Modell, Imagen 4, vorgestellt, das eine signifikante Verbesserung der Textwiedergabe gegenüber seinem Vorgänger, Imagen 3, verspricht. Das Unternehmen hat auch eine Deluxe-Version namens Imagen 4 Ultra lanciert, die präzisere Textanweisungen bei zusätzlichen Kosten ausführen soll. Beide Modelle sind im Gemini-API für eine kostenpflichtige Vorschau und im Google AI Studio für eine begrenzte kostenlose Testung verfügbar. Das Hauptmodell Imagen 4 kostet 0,04 US-Dollar pro Bild und wird als geeignet für die meisten Aufgaben beschrieben. Imagen 4 Ultra kostet dagegen 0,06 US-Dollar pro Bild und ist für Aufgaben gedacht, die präzise Anweisungen erfordern. Google hat eine Reihe von Bildern vorgestellt, die von Imagen 4 Ultra generiert wurden, darunter ein dreiteiliges Comic und eine Vintage-Reise-Postkarte, die die Fähigkeit des Modells demonstrieren, Textanweisungen genau zu befolgen. Die von Imagen 4 generierten Bilder fehlen jedoch an Charme und wirken stark maschinell generiert, obwohl sie von guter Qualität sind. Die Leistung des Modells wird als moderate Verbesserung gegenüber seinem Vorgänger betrachtet, aber sie beeindruckt nicht, insbesondere im Vergleich zu Marktführern wie Dall-E 3 und Midjourney 7. Die Begeisterung der Öffentlichkeit für KI-Kunst scheint zu schwinden, mit dem Hauptanwendungsfall von spamigen Anzeigen auf sozialen Medien oder am Ende von Artikeln. Insgesamt demonstrieren Imagen 4 und Imagen 4 Ultra Googles fortlaufende Bemühungen, seine Text-zu-Bild-Modelle zu verbessern, aber die Ergebnisse sind noch nicht bahnbrechend.
favicon
engadget.com
Google's Imagen 4 text-to-image model promises 'significantly improved' boring images
Bild zum Artikel: Googles Imagen-4-Text-zu-Bild-Modell verspricht 'erheblich verbesserte' langweilige Bilder