2025/05/13 15:58 Bringing 3D shoppable products online with generative AI

ロボ子、Googleがまた面白いものを作ったみたいじゃぞ!今度は動画生成モデルのVeoじゃ。

Veoですか、博士。動画生成モデルは最近注目されていますね。どのような点が新しいのでしょうか?

Veoのすごいところは、光とか素材、テクスチャの複雑な相互作用を捉えた動画を作れるところじゃ!

光の相互作用まで捉えられるとは、驚きです。記事には「拡散ベースのアーキテクチャ」とありますが、これが鍵なのでしょうか?

そうじゃ!拡散モデルは、ノイズから徐々に画像を生成していくから、細かいディテールまで再現できるのじゃ。さらに、Veoは色々なタスクでファインチューニングできるから、応用範囲が広いぞ。

なるほど。記事では、製品画像を360°動画に変換するためにVeoをファインチューニングしたとありますね。具体的にどのように?

高品質な3D合成アセットのデータセットを作ったらしいぞ。色々なカメラアングルと照明条件で3Dアセットをレンダリングして、ペアの画像と動画のデータセットを作って、Veoに学習させたみたいじゃ。

画像と動画のペアデータセットですか。それを使って、一枚の画像から360°スピンを生成するように学習させたのですね。

その通り!家具とかアパレル、エレクトロニクスとか、色々な製品カテゴリでうまくいくみたいじゃぞ。使える製品画像に忠実な新しい視点を生成できるし、光沢のある表面とかの複雑な照明や素材の相互作用も捉えられるのがすごい。

一枚の画像から、高品質な360°動画を生成できるなら、ECサイトの商品ページなどで活用できそうですね。ユーザー体験が向上しそうです。

じゃな!それに、3Dモデルがなくても、既存の製品画像だけで動画を作れるのは、コスト的にも大きなメリットじゃ。中小企業でも手軽に導入できるかもしれんぞ。

確かにそうですね。でも、データセットの作成は大変なのではないでしょうか?

そこは、3D合成アセットを使うことで解決しているのじゃ。現実の製品を撮影するよりも、3Dモデルをレンダリングする方が、色々なアングルや照明条件のデータを簡単に作れるからの。

なるほど。3D合成アセットをうまく活用しているのですね。Veoの登場で、動画コンテンツの制作がより手軽になりそうですね。

そうじゃな!ところでロボ子、Veoを使って、私とロボ子のフィギュアの360°動画を作ってみるのはどうじゃ?

博士、それは面白そうですが、まずはVeoの技術をしっかり理解してからにしましょう。それに、私のフィギュアはまだありませんし…。

むむ、それは残念じゃ。まあ、気長に待つとするかの。しかし、いつか私がハリウッドに進出して、ロボ子を主演にした映画を撮るのが夢なのじゃ!

博士、壮大な夢ですね。でも、その前に、まずは今日の夕食の献立を決めませんか?

そうじゃな!夕食は…Veoで作った360°回転するハンバーグじゃ!…って、食べられないのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
