Google은 이전 버전인 Imagen 3보다 텍스트 렌더링이 크게 개선된 최신 텍스트-이미지 변환 모델인 Imagen 4를 출시했습니다. 또한 추가 비용을 지불하면 더 정확한 텍스트 프롬프트를 따르도록 설계된 Imagen 4 Ultra라는 디럭스 버전도 출시했습니다. 두 모델 모두 Gemini API에서 유료 미리 보기를 사용할 수 있으며 Google AI Studio에서 제한적으로 무료 테스트가 가능합니다. 기본 Imagen 4 모델의 가격은 이미지당 0.04달러이며 대부분의 작업에 적합하다고 설명되어 있습니다. 반면 Imagen 4 Ultra의 가격은 이미지당 0.06달러이며 정밀한 지시를 따라야 하는 작업에 적합합니다. Google은 텍스트 프롬프트를 정확하게 따르는 모델의 능력을 보여주는 세 컷 만화와 빈티지 여행 엽서 등 Imagen 4 Ultra로 생성된 다양한 이미지를 선보였습니다. 그러나 Imagen 4로 생성된 이미지는 좋은 품질에도 불구하고 매력이 부족하고 기계적으로 생성된 것처럼 보입니다. 이 모델의 성능은 이전 모델보다 약간 개선된 것으로 간주되지만, 특히 Dall-E 3 및 Midjourney 7과 같은 시장 리더와 비교할 때 깊은 인상을 남기지 못합니다. 소셜 미디어나 기사 하단의 스팸성 광고가 주요 사용 사례로, AI 아트에 대한 대중의 열정은 점점 줄어들고 있는 것으로 보입니다. 전반적으로 이미젠 4와 이미젠 4 울트라는 텍스트-이미지 모델을 개선하기 위한 Google의 지속적인 노력을 보여주지만 아직 획기적인 결과는 아닙니다.
engadget.com
Google's Imagen 4 text-to-image model promises 'significantly improved' boring images
Create attached notes ...
