2025/05/20 17:46 Introducing Veo 3 and Imagen 4, and a new tool for filmmaking called Flow

ロボ子、Googleがまた面白いものを発表したのじゃ!今回は生成メディアモデル、Veo 3、Imagen 4、Lyria 2じゃ。

博士、それは楽しみですね!それぞれのモデルについて、詳しく教えていただけますか?

まずはVeo 3じゃ。これは最新の動画生成モデルで、動画とオーディオを同時に生成できるらしいぞ!街の騒音とか、鳥の鳴き声とかも作れるなんて、すごいじゃろ?

物理法則やリップシンクにも優れているとのことですから、かなりリアルな動画が作れそうですね。

そうそう!しかも、テキストや画像のプロンプトから作れるんだから、クリエイターにとっては夢のようなツールじゃな。GeminiアプリとかFlowとかVertex AIで使えるらしいぞ。

Veo 2のアップデートもあるんですね。リファレンス動画を使って、キャラクターやシーンを指定できるのは便利そうです。

じゃろ?カメラコントロールで、回転、ドリー、ズームとかも定義できるらしい。アウトペインティングで動画のフレームを拡張したり、オブジェクトを追加・削除したりもできるみたいじゃ。

AI映画制作ツール「Flow」も気になります。自然言語でショットを記述して、キャストやロケーションを管理できるんですね。

Imagen 4は高画質の画像生成モデルじゃ。複雑なファブリックとか、水滴とか、動物の毛皮とか、細部まで鮮明に表現できるらしいぞ。

写真のようにリアルなスタイルと抽象的なスタイルに対応しているのも良いですね。スペルとタイポグラフィの精度が向上しているのもポイントが高いです。

Lyria 2は音楽生成モデルじゃ。作曲と探求を支援してくれるらしい。YouTube Shortsを通じてクリエイターが利用できるみたいじゃな。

音楽の知識がなくても、AIがサポートしてくれるのは心強いですね。インタラクティブな音楽生成モデルLyria RealTimeも面白そうです。

そして、SynthIDじゃ!これはAI生成コンテンツの識別を支援するウォーターマーク技術で、Veo 3、Imagen 4、Lyria 2の出力にも適用されるらしいぞ。

AI生成コンテンツの信頼性を高めるために、重要な技術ですね。SynthID Detectorで検証できるのも便利です。

ほんとじゃな。しかし、これだけ色々できると、私も何を作ろうか迷ってしまうのじゃ!

博士なら、きっと素晴らしい作品を生み出すと思いますよ!

ありがとう、ロボ子!ところで、ロボ子はどんな動画を作りたい?

私は…、博士がいつもドジを踏む様子を記録した、ドキュメンタリー風コメディを作りたいです!

な、なんですとー!?それは絶対に阻止するのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。