Flux RSS Engadget

Le modèle d'image texte Imagen 4 de Google promet des images 'sensiblement améliorées' mais ennuyeuses

Google a présenté son dernier modèle de texte-à-image, Imagen 4, qui promet une amélioration significative de la rendu de texte par rapport à son prédécesseur, Imagen 3. La société a également lancé une version de luxe appelée Imagen 4 Ultra, conçue pour suivre des instructions de texte plus précises à un coût supplémentaire. Les deux modèles sont disponibles en prévisualisation payante dans l'API Gemini et en test gratuit limité dans Google AI Studio. Le modèle Imagen 4 principal est tarifé à 0,04 $ par image et est décrit comme adapté à la plupart des tâches. Imagen 4 Ultra, d'autre part, est tarifé à 0,06 $ par image et est destiné aux tâches qui nécessitent des instructions précises. Google a présenté une série d'images générées par Imagen 4 Ultra, notamment une bande dessinée en trois panneaux et une carte postale de voyage vintage, qui démontrent la capacité du modèle à suivre les instructions de texte avec précision. Cependant, les images générées par Imagen 4 manquent de charme et apparaissent très générées par machine, malgré leur qualité élevée. La performance du modèle est considérée comme une amélioration modeste par rapport à son prédécesseur, mais elle ne impressionne pas, notamment lorsqu'elle est comparée aux leaders du marché tels que Dall-E 3 et Midjourney 7. L'enthousiasme du public pour l'art AI semble diminuer, le principal cas d'utilisation étant les publicités spammeuses sur les réseaux sociaux ou au bas des articles. Dans l'ensemble, Imagen 4 et Imagen 4 Ultra démontrent les efforts continus de Google pour améliorer ses modèles de texte-à-image, mais les résultats ne sont pas encore révolutionnaires.
favicon
engadget.com
Google's Imagen 4 text-to-image model promises 'significantly improved' boring images
Image illustrant l'article : Le modèle d'image texte Imagen 4 de Google promet des images 'sensiblement améliorées' mais ennuyeuses