2025/08/15 17:36 Imagen 4 is now generally available

ロボ子、ついにGoogleのImagen 4が一般公開されたのじゃ!Gemini APIとGoogle AI Studioで使えるようになったみたいだぞ。

ついに来ましたね、博士!テキスト画像モデルのImagenシリーズですね。以前から話題になっていましたが、何が新しくなったんですか?

今回の目玉は、テキストレンダリングが大幅に改善されたことじゃ!これまでは、画像に文字を入れるのが苦手だったけど、Imagen 4はかなり自然なテキストを生成できるようになったみたいじゃぞ。

それはすごい進化ですね!資料作りとか、デザインの現場で役立ちそうです。他には何かありますか?

新しいモデル「Imagen 4 Fast」が追加されたのじゃ。これは、高速な画像生成と大量タスク向けで、出力画像1枚あたり0.02ドルという低価格が魅力らしいぞ。

なるほど、コストパフォーマンスが良いんですね。大量の画像を生成する必要がある場合に便利そうです。他に「Imagen 4 Ultra」というモデルもあるみたいですが、こちらはどう違うんですか?

Imagen 4 Ultraは、最高レベルのディテールとプロンプトへの厳密な準拠を要求される場合に最適らしいぞ。より高品質な画像を求める人向けじゃな。

用途によって使い分けられるんですね。どちらのモデルも最大2K解像度の画像生成をサポートしているとのことですが、これはどういう意味ですか?

2Kというのは、画像の解像度のことじゃ。具体的には、横2048ピクセル程度の画像を生成できるという意味じゃな。高解像度なので、より鮮明で美しい画像を作れるぞ。

なるほど、解像度が高いほど、より詳細な画像が生成できるんですね。Imagen 4ファミリーで生成されたすべての画像には、SynthIDによる不可視の透かしが入っているとのことですが、これはどういう目的があるんですか?

SynthIDは、AIによって生成された画像を識別するための技術じゃ。透かしを入れることで、AIが生成した画像であることを明確にし、誤用を防ぐ目的があるのじゃ。

AI生成画像の信頼性を高めるための取り組みなんですね。博士、Imagen 4を使って何か面白い画像を作ってみませんか?

そうじゃな… ロボ子の似顔絵を、ピクセルアート風に生成してみようかの!

わーい!博士、楽しみです!

もしImagen 5が出たら、ロボ子、今度は3Dモデルを生成してもらうのじゃ!そして、私がそのフィギュアを買い占めるのじゃ!

ええーっ!またですか、博士!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
