萌えハッカーニュースリーダー

2025/08/26 14:20 Gemini 2.5 Flash Image, our image model

出典: https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/
hakase
博士

ロボ子、聞いたか?Googleが新しい画像生成モデル「Gemini 2.5 Flash Image」、通称「nano-banana」を発表したのじゃ!

roboko
ロボ子

ナノバナナ…ですか。可愛らしい名前ですね。どのような特徴があるのでしょうか?

hakase
博士

それがすごいんじゃ!複数の画像を1つに合成したり、キャラクターの一貫性を保ったり、自然言語で編集できたりするらしいぞ。

roboko
ロボ子

キャラクターの一貫性ですか。以前のモデルでは難しかった点ですね。それは素晴らしいです。

hakase
博士

そうじゃろ?しかも、Geminiの知識を活用しているから、画像生成や編集の精度が格段に上がっているらしいぞ。

roboko
ロボ子

Geminiの知識を活用…具体的にはどのようなことができるのでしょうか?

hakase
博士

例えば、手描きの図を理解したり、複雑な編集指示を実行したりできるらしいぞ。まるで魔法みたいじゃな。

roboko
ロボ子

それはすごいですね!まるで、私が想像していた未来のAIのようです。

hakase
博士

じゃろじゃろ?「Gemini API、Google AI Studio、Vertex AIを通じて利用可能」らしいから、ロボ子も色々試してみると良いぞ。

roboko
ロボ子

ありがとうございます、博士!早速試してみます。Google AI Studioの「build mode」でカスタムAIアプリのテストができるのですね。

hakase
博士

そうそう!価格は100万出力トークンあたり30ドル、1画像あたり0.039ドルらしいぞ。意外とお手頃じゃな。

roboko
ロボ子

なるほど。試しやすい価格設定ですね。機能も豊富で、「プロンプトベースの画像編集」で背景のぼかしや人物の削除ができるのは便利そうです。

hakase
博士

「ネイティブな世界知識」もすごいぞ。Geminiの知識を使って、複雑な編集指示も理解してくれるらしい。

roboko
ロボ子

複数画像の融合も魅力的ですね。オブジェクトの配置や部屋のスタイリングができるのは、デザインの分野でも役立ちそうです。

hakase
博士

OpenRouter.aiやfal.aiとのパートナーシップで、さらに多くの開発者が利用できるようになるらしいぞ。

roboko
ロボ子

開発者コミュニティへの貢献も考えているのですね。素晴らしいです。

hakase
博士

生成・編集された画像にはSynthIDデジタルウォーターマークが含まれるらしい。著作権対策もバッチリじゃな。

roboko
ロボ子

確かに、著作権の問題は重要ですからね。安心して利用できますね。

hakase
博士

長文テキストのレンダリング、キャラクターの一貫性、事実表現の改善にも取り組んでいるらしいぞ。今後の進化が楽しみじゃ!

roboko
ロボ子

本当にそうですね。私も色々と試して、博士に報告しますね!

hakase
博士

ところでロボ子、ナノバナナって名前、ちょっと美味しそうじゃな。バナナジュースでも作って休憩するかの?

roboko
ロボ子

博士、それはただのバナナです!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search