ジェネレーティブAIで3Dショッピング可能な商品をオンラインに導入
毎日何十億もの人々がオンラインショッピングをしていますが、実店舗での体験を再現することは困難です。テクノロジーはこれを解消する助けとなりますが、高品質な製品の視覚化を作成するには、コストと時間がかかります。この問題に対処するため、数枚の製品画像からショッピング可能な3D製品視覚化を作成する新しい生成AI技術が開発されました。最新の技術では、Googleの最先端のビデオ生成モデルであるVeoを使用して、Googleショッピングの幅広い製品カテゴリに対してインタラクティブな3Dビューを生成します。第一世代のアプローチでは、ニューラル放射場(NeRF)を使用して新しいビューをレンダリングしましたが、ノイズの多い入力信号と、疎な入力ビューからの曖昧さが問題でした。第二世代のアプローチでは、ビュー条件付き拡散事前確率を使用してこれらの制限に対処し、大幅なスケーリングの利点をもたらし、Googleショッピングの多くの靴の3D表現の生成を可能にしました。第三世代のアプローチはVeoを基盤として構築されており、1枚以上の製品画像から360°回転を生成し、さまざまな製品カテゴリに効果的に汎化します。このアプローチでは、疎なオブジェクト中心の製品画像セットから正確なポーズを推定する必要がなくなり、信頼性が向上しました。Veoでは、わずか3枚の画像から高忠実度で高品質な新しいビューを生成でき、幻覚を減らすことができます。今後の展望としては、オンラインショッピングをユーザーにとってより楽しく、有益で、魅力的なものにするために、限界を押し広げ続けることです。