O Google expandiu o acesso ao seu gerador de imagens de IA, Imagen 3, para todos os usuários nos EUA, após o seu lançamento limitado durante o evento Google I/O de maio de 2024. O Imagen 3 é descrito como um modelo de difusão latente que cria imagens de alta qualidade a partir de prompts de texto e é considerado pelo Google superior a outros modelos de ponta. No entanto, os usuários relataram reações mistas, observando que a ferramenta agora é mais sensível aos prompts, frequentemente censurando palavras benignas como "meia" ou "água". Essa maior sensibilidade tornou mais difícil para os usuários alcançarem resultados desejados em comparação com a versão anterior, Imagen 2. Por outro lado, o modelo foi elogiado por sua saída de alta qualidade e reconhecimento de textura e palavra melhorado. A expansão ocorre em meio a controvérsias em curso sobre geradores de imagens de IA, com ferramentas como o Grok-2 AI de Elon Musk enfrentando críticas por falta de guardrails, permitindo a criação de imagens inapropriadas ou ofensivas. O Google parece estar adotando uma abordagem cautelosa com o Imagen 3, priorizando restrições para evitar problemas semelhantes. Se essa abordagem cautelosa mudará à medida que o modelo evolui, permanece incerto. A maior disponibilidade do Imagen 3 provavelmente levará a mais exploração de seus limites pelos usuários.
www.techradar.com
Google just rolled out its answer to Midjourney – here’s how to try the AI image generator
Create attached notes ...