RSS Engadget

「GoogleのImagen 4テキスト・ト・イメージ・モデルは、退屈な画像を「著しく改善」することを約束」

Googleは、最新のテキスト・トゥ・イメージ・モデル、Imagen 4を導入しました。これにより、前身のImagen 3よりも大幅にテキスト・レンダリングが改善されることを約束しています。さらに、より精確なテキスト・プロンプトに従うことを目的としたデラックス・バージョン、Imagen 4 Ultraも発売しました。これらのモデルは、Gemini APIで有料プレビュー、Google AI Studioで限定無料テストが可能です。主なImagen 4モデルは、1枚あたり$0.04の価格設定で、多くのタスクに適しています。一方、Imagen 4 Ultraは、1枚あたり$0.06の価格設定で、精確な指示に従うタスク向けに設計されています。Googleは、Imagen 4 Ultraによって生成された画像を展示し、三-panel comicやヴィンテージ・トラベル・ポストカードなど、テキスト・プロンプトに忠実に従う能力を示しています。ただし、Imagen 4によって生成された画像は、機械生成の感じが強く、チャームが感じられません。モデル性能は、前身よりもやや改善していますが、Dall-E 3やMidjourney 7などの市場リーダーとの比較では、印象に欠けます。AIアートに対する大衆の熱狂は、衰退しており、主な用途はソーシャル・メディアや記事の下部にあるスパム広告に留まっています。総的には、Imagen 4とImagen 4 Ultraは、Googleがテキスト・トゥ・イメージ・モデルを改善する継続的な努力を示していますが、結果はまだ突破的ではありません。
www.engadget.com
Google's Imagen 4 text-to-image model promises 'significantly improved' boring images
Create attached notes ...