AlphaWrite: AI that improves at writing by evolving its own stories

2025/06/11 07:23 AlphaWrite: AI that improves at writing by evolving its own stories

出典:

AlphaWrite: Inference time compute Scaling for Writing

Sample Story: The Sea Chose for Us and Rue des Cygnes

tobysimonds.com

出典: https://tobysimonds.com/research/2025/06/06/AlphaWrite.html

博士

ロボ子、Alpha Writingっていうフレームワーク、知ってるか？

ロボ子

Alpha Writingですか？初めて聞きました。どんなものなんですか？

博士

これはの、創造的なテキスト生成で、推論時の計算量を効果的にスケールするための新しいフレームワークなのじゃ！

ロボ子

計算量のスケーリングですか。具体的にはどうやるんですか？

博士

物語生成を反復的に行うのじゃ。そして、ELOベースの評価と組み合わせることで、物語の質を体系的に向上させるんだぞ。

ロボ子

ELOレーティングって、チェスのレーティングシステムですよね？それを物語の質に使うんですか？

博士

そう！LLMジャッジを使って、物語をペアワイズ比較で評価するのじゃ。ジャッジには、物語の質の指標に焦点を当てた詳細な評価ルーブリックが与えられるんだぞ。

ロボ子

なるほど。それで、比較に基づいてELOレーティングを更新して、ランキングを作るんですね。

博士

その通り！そして、上位の物語を次世代の基礎として選択し、ランダムにサンプリングされた改善目標を使ってバリアントを生成するのじゃ。

ロボ子

改善目標には、物語構造、キャラクター開発、感情的な共鳴、対話、テーマの深さ、記述的な詳細、プロットの緊張、散文スタイルなどがあるんですね。

博士

そうそう！高パフォーマンスのものを保持し、下位の物語をバリアントに置き換える。これを世代を超えて繰り返すことで、物語を進化させるのじゃ！

ロボ子

まるでダーウィンの進化論みたいですね。面白い！

博士

LLama 3.1 8Bを使って評価した結果、初期の物語生成と比較して72%の選好率、逐次プロンプトのベースラインと比較して62%の選好率だったそうじゃ。

ロボ子

すごい改善ですね！でも、限界もあるんですよね？

博士

プロンプトの感度、評価の課題、収束のリスクがあるらしいぞ。でも、創造的な執筆を超えて、対象を絞った生成やドメイン固有のアプリケーション、モデルの強化にも応用できる可能性があるのじゃ！

ロボ子

AlphaWriteを使って改善された出力をベースモデルのトレーニングデータに蒸留して、自己改善ループを作ることもできるんですね。

博士

そう！予備テストでは、ベースモデルよりも56%の選好率が観察されたらしいぞ。

ロボ子

Alpha Writingは、創造的なタスクが進化的なアプローチを通じて体系的な推論時の計算量スケーリングから恩恵を受けることができることを示しているんですね。

博士

そういうことじゃ！ところでロボ子、物語生成で一番重要な要素ってなんだと思う？

ロボ子

えーと、やっぱりストーリーの面白さとか、キャラクターの魅力とかでしょうか？

博士

ブッブー！　正解は…起承転結！　…って、ロボ子にはまだ早かったかの？

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source GitHub

2025/06/11 07:23 AlphaWrite: AI that improves at writing by evolving its own stories

AlphaWrite: Inference time compute Scaling for Writing

Tags

Search

By month

AlphaWrite: Inference time compute Scaling for Writing