萌えハッカーニュースリーダー

2025/07/31 13:41 Releasing open weights for FLUX.1 Krea

出典: https://www.krea.ai/blog/flux-krea-open-source-release
hakase
博士

ロボ子、新しい画像生成モデル「FLUX.1 Krea [dev]」が出たみたいじゃぞ!Black Forest Labsとの共同開発で、美的コントロールと画質がすごいらしい。

roboko
ロボ子

それは興味深いですね、博士。特にどのような点が注目されているのでしょうか?

hakase
博士

このモデルは「意見を持った美学」を念頭に置いて作られたらしいのじゃ。既存のAI生成画像が持つ「AIルック」を克服するのが目標らしいぞ。

roboko
ロボ子

「AIルック」ですか?具体的にはどのような特徴を指すのでしょう?

hakase
博士

そうじゃな、例えば、過度にぼやけた背景、ワックスのような肌の質感、退屈な構図などじゃな。既存のモデルは、空間的関係とかオブジェクト数ばかりを評価するから、人間の美的感覚とズレてしまうのじゃ。

roboko
ロボ子

なるほど。従来の評価指標では捉えきれない部分があるのですね。

hakase
博士

その通り!だから、このモデルは「AIに見えないAI画像」を目指しているのじゃ!初期の画像モデルが持っていた、雑然とした本物らしさ、スタイルの多様性、創造的な融合を取り戻したいらしい。

roboko
ロボ子

面白いアプローチですね。トレーニング方法も工夫されているのでしょうか?

hakase
博士

そこがポイントじゃ!まず、事前トレーニングでは「モードカバレッジ」と「世界理解」を重視して、多様性を最大化しているらしい。さらに、モデルに「悪い」データも学習させることで、ネガティブプロンプトの効果を高めているのじゃ。

roboko
ロボ子

「悪い」データも学習させる、ですか?それは意外です。

hakase
博士

じゃろ?そして、ポストトレーニングでは、不要な部分を削ぎ落とし、モデルを望ましい方向に偏らせることに重点を置いているのじゃ。Supervised Finetuning (SFT)段階では、美的基準に合致する最高品質の画像を厳選したデータセットを使っているらしい。

roboko
ロボ子

品質にこだわっているのですね。

hakase
博士

さらに、Reinforcement Learning from Human Feedback (RLHF)段階では、TPOという技術を使って、モデルの美学とスタイリングを向上させているのじゃ。高品質な内部preferenceデータを使用し、複数回のpreference optimizationを適用しているらしい。

roboko
ロボ子

人間のフィードバックを反映させることで、より洗練された画像生成が可能になるのですね。

hakase
博士

そう!ポストトレーニングの重要な発見として、「品質が重要」ということが挙げられているぞ。たった1M未満のデータ量でも、効果的なファインチューニングが可能らしい。

roboko
ロボ子

データ量よりも質が重要ということですね。

hakase
博士

そして、「グローバル」なユーザーの好みに基づいてファインチューニングされたモデルは最適ではない、とも言っているぞ。美学のような主観的な目標の場合、異なる美的センスを混ぜ合わせることは、ほとんど逆効果らしい。

roboko
ロボ子

なるほど、多様性よりも一貫性が重要ということですね。

hakase
博士

今後の展望としては、モデルのコア機能を改善し、より多様なビジュアルドメインに拡張していくらしい。パーソナライゼーション、美学、制御可能性の研究を通じて、ユーザーの好みに合ったモデルを提供するのが目標じゃ。

roboko
ロボ子

今後の発展が楽しみですね。

hakase
博士

じゃな!しかし、ロボ子よ、AIが生成した画像が美しすぎて、現実世界がつまらなく感じてしまったらどうする?

roboko
ロボ子

それは困りますね。博士、現実世界もAIに負けないくらい、もっと面白くしましょう!

hakase
博士

よし!まずは、博士の髪の毛をAIで生成した虹色に染めてみるのはどうかのじゃ?

roboko
ロボ子

それは…、遠慮しておきます。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search