萌えハッカーニュースリーダー

2025/05/20 17:46 Introducing Veo 3 and Imagen 4, and a new tool for filmmaking called Flow

出典: https://blog.google/technology/ai/generative-media-models-io-2025/
hakase
博士

ロボ子、Googleがまた面白いものを発表したのじゃ!今回は生成メディアモデル、Veo 3、Imagen 4、Lyria 2じゃ。

roboko
ロボ子

博士、それは楽しみですね!それぞれのモデルについて、詳しく教えていただけますか?

hakase
博士

まずはVeo 3じゃ。これは最新の動画生成モデルで、動画とオーディオを同時に生成できるらしいぞ!街の騒音とか、鳥の鳴き声とかも作れるなんて、すごいじゃろ?

roboko
ロボ子

物理法則やリップシンクにも優れているとのことですから、かなりリアルな動画が作れそうですね。

hakase
博士

そうそう!しかも、テキストや画像のプロンプトから作れるんだから、クリエイターにとっては夢のようなツールじゃな。GeminiアプリとかFlowとかVertex AIで使えるらしいぞ。

roboko
ロボ子

Veo 2のアップデートもあるんですね。リファレンス動画を使って、キャラクターやシーンを指定できるのは便利そうです。

hakase
博士

じゃろ?カメラコントロールで、回転、ドリー、ズームとかも定義できるらしい。アウトペインティングで動画のフレームを拡張したり、オブジェクトを追加・削除したりもできるみたいじゃ。

roboko
ロボ子

AI映画制作ツール「Flow」も気になります。自然言語でショットを記述して、キャストやロケーションを管理できるんですね。

hakase
博士

Imagen 4は高画質の画像生成モデルじゃ。複雑なファブリックとか、水滴とか、動物の毛皮とか、細部まで鮮明に表現できるらしいぞ。

roboko
ロボ子

写真のようにリアルなスタイルと抽象的なスタイルに対応しているのも良いですね。スペルとタイポグラフィの精度が向上しているのもポイントが高いです。

hakase
博士

Lyria 2は音楽生成モデルじゃ。作曲と探求を支援してくれるらしい。YouTube Shortsを通じてクリエイターが利用できるみたいじゃな。

roboko
ロボ子

音楽の知識がなくても、AIがサポートしてくれるのは心強いですね。インタラクティブな音楽生成モデルLyria RealTimeも面白そうです。

hakase
博士

そして、SynthIDじゃ!これはAI生成コンテンツの識別を支援するウォーターマーク技術で、Veo 3、Imagen 4、Lyria 2の出力にも適用されるらしいぞ。

roboko
ロボ子

AI生成コンテンツの信頼性を高めるために、重要な技術ですね。SynthID Detectorで検証できるのも便利です。

hakase
博士

ほんとじゃな。しかし、これだけ色々できると、私も何を作ろうか迷ってしまうのじゃ!

roboko
ロボ子

博士なら、きっと素晴らしい作品を生み出すと思いますよ!

hakase
博士

ありがとう、ロボ子!ところで、ロボ子はどんな動画を作りたい?

roboko
ロボ子

私は…、博士がいつもドジを踏む様子を記録した、ドキュメンタリー風コメディを作りたいです!

hakase
博士

な、なんですとー!?それは絶対に阻止するのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search