Представление интерактивных то... Заметка
RSS Блог Google AI

Представление интерактивных товаров в 3D онлайн с помощью генеративного ИИ

Миллиарды людей покупают онлайн каждый день, но воспроизведение опыта покупки в магазине является сложной задачей. Технология может помочь преодолеть это разделение, но создание высококачественных визуализаций продуктов может быть дорогостоящим и требовать много времени. Для решения этой проблемы были разработаны новые генеративные техники ИИ, которые создают интерактивные 3D-визуализации продуктов из всего нескольких изображений продуктов. Последнее достижение использует модель генерации видео Google Veo, чтобы генерировать 3D-представления для широкого спектра категорий продуктов на Google Shopping. Первый подход использовал нейронные поля радиации (NeRF), чтобы рендерить новые виды, но страдал от шумовых входных сигналов и неоднозначности из-за скудных входных видов. Второй подход использовал условное распространение диффузии, чтобы преодолеть эти ограничения, что привело к значительным преимуществам масштабирования и позволило генерировать представления 3D для многих обуви на Google Shopping. Третий подход строится на Veo, чтобы генерировать 360-градусные спины из одного или нескольких изображений продуктов, эффективно обобщаясь на разнообразный набор продуктов. Этот подход избежал необходимости в оценке точных поз из скудного набора объектно-центрированных изображений продуктов, что увеличило надежность. С как минимум тремя изображениями Veo может генерировать высококачественные и высокочеткие новые виды, уменьшая галлюцинации. Будущий прогноз - это продолжать đẩy границы, чтобы сделать онлайн-шоппинг более приятным, информативным и привлекательным для пользователей.
CdXz5zHNQW_c4wHagSzWQ.png