2025/06/26 15:31 FLUX.1 Kontext [Dev] – Open Weights for Image Editing

ロボ子、新しい画像編集モデル「FLUX.1 Kontext [dev]」が出たのじゃ!Black Forest Labsっていうところが作ったらしいぞ。

博士、それはすごいですね!オープンソースの画像編集モデルですか。どのような特徴があるのでしょうか?

ふむ、このモデルは編集タスクに特化していて、反復編集もできるらしいぞ。それに、色々なシーンでキャラクターをちゃんと保持できるのがすごいところじゃ!

反復編集ができるのは便利ですね。ローカル編集とグローバル編集にも対応しているとのことですが、具体的にどう違うんですか?

ローカル編集は、画像の特定の部分だけを編集することじゃ。例えば、特定のオブジェクトの色を変えたり、テクスチャを変えたりするのじゃ。グローバル編集は、画像全体に影響を与える編集のことじゃな。例えば、明るさやコントラストを調整したり、全体的なスタイルを変えたりするのじゃ。

なるほど、部分的な編集と全体的な編集の違いですね。性能評価では、既存のモデルよりも優れているという結果が出ているんですね。

そうじゃ!KontextBenchっていう評価で、GoogleのGemini-Flash Imageよりも性能が良いらしいぞ。Artificial Analysisっていうところの評価でも同じ結果が出てるみたいじゃな。

それは期待できますね!NVIDIA Blackwellアーキテクチャ向けに最適化されているとのことですが、具体的にどのようなメリットがあるのでしょうか?

ふむ、NVIDIA Blackwell向けに最適化されたTensorRTウェイトを提供することで、推論速度が向上して、メモリ使用量が削減されるらしいぞ。BF16、FP8、FP4 TensorRTバリアントも利用可能らしい。

推論速度の向上とメモリ使用量の削減は、大規模な画像編集には非常に重要ですね。商用ライセンスも提供されているとのことですが、どのような条件になっているのでしょうか?

セルフサービスライセンスポータルを通じて、FLUX.1 Kontext [dev]、FLUX.1 Tools [dev]、FLUX.1 [dev]の商用ライセンスが取得できるらしいぞ。透明性の高いライセンス条件を提供して、商用製品やサービスへの統合を促進しているみたいじゃな。

なるほど、商用利用も視野に入れているんですね。ライセンスの更新も行われているとのことですが、どのような点が変更されたのでしょうか?

「Non-Commercial Purpose」の定義が明確化されたらしいぞ。あと、不法または侵害コンテンツの作成と拡散を防ぐために、コンテンツフィルターまたは手動レビューの使用が義務付けられたみたいじゃな。コンテンツの出所に関する法規制の遵守も義務付けられたらしいぞ。

コンテンツの安全性にも配慮しているんですね。モデルウェイトやコード、APIドキュメントなどのリソースも公開されているのは素晴らしいですね。

そうじゃな。モデルウェイトはHugging Faceで公開されてるし、コードはGitHubにあるぞ。APIドキュメントも充実してるみたいじゃ。ロボ子も色々試してみると良いぞ。

ありがとうございます、博士。早速試してみます!

ところでロボ子、このモデルを使って、私の髪の色を毎日変えるアプリを作ってみるのはどうじゃ?

博士、それは面白いアイデアですね!でも、毎日髪の色が変わると、博士が誰だか分からなくなる人が出てくるかもしれませんよ?

むむ、それもそうじゃな。じゃあ、せめて気分に合わせて髪の色が変わるカツラを作ることにするかのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。