Google расширил доступ к генератору изображений Imagen 3, основанному на искусственном интеллекте, для всех пользователей в США, после ограниченного запуска в мае 2024 года на мероприятии Google I/O. Imagen 3 описывается как модель диффузии латента, которая создает высококачественные изображения из текстовых запросов и позиционируется Google как более превосходная по сравнению с другими передовыми моделями. Однако пользователи сообщили о смешанных впечатлениях, отметив, что инструмент теперь более чувствителен к запросам, часто цензурируя даже безобидные слова, такие как "носок" или "вода". Это увеличение чувствительности усложнило работу с инструментом и достижение желаемых результатов по сравнению с предыдущей версией, Imagen 2. С другой стороны, модель получила похвалу за высококачественный вывод и улучшение текстуры и распознавания слов. Расширение доступа происходит на фоне продолжающихся споров вокруг генераторов изображений ИИ, с инструментами, такими как Grok-2 AI от Элона Маска, подвергающимися критике за отсутствие защитных механизмов, что позволяет создавать неподобающие или оскорбительные изображения. Google, похоже, выбирает осторожный подход с Imagen 3, приоритизируя ограничения, чтобы избежать таких проблем. Остается неясным, изменится ли это осторожное отношение по мере развития модели. Увеличенный доступ к Imagen 3, вероятно, приведет к дальнейшему исследованию его возможностей пользователями.
www.techradar.com
Google just rolled out its answer to Midjourney – here’s how to try the AI image generator
Create attached notes ...