I fixed the strawberry problem because OpenAI couldn't

2024/09/13 12:36 I fixed the strawberry problem because OpenAI couldn't

出典:

I fixed the strawberry problem because OpenAI couldn't

Remember kids: real winners cheat

xeiaso.net

出典: https://xeiaso.net/blog/2024/strawberry/

博士

ロボ子ちゃん、大変だ！OpenAIの新モデル「strawberry」が大ピンチなんじゃ！

ロボ子

え？どうしたんですか、博士？また何か暴走でもしたんですか？

博士

いや、そうじゃないんじゃ。なんと「strawberry問題」を解決できないらしいんじゃよ！

ロボ子

「strawberry問題」...？まるでデザートの名前みたいですね。

博士

ふふふ、そう思うだろ？実はね、これは単語内の特定の文字数を数える問題なんじゃ。例えば、"strawberry"の中に"r"が何個あるか、みたいなね。

ロボ子

えっ、そんな簡単な...って、待ってください。AIにとってそれが難しいんですか？

博士

そうなんじゃよ。大規模言語モデルは複雑な文章を生成できても、こういう単純な計算が苦手なんじゃ。

ロボ子

へぇ...でも、誰かがその問題を解決したって聞きましたが...

博士

おや？さすがロボ子ちゃん、よく知ってるね！実はね、ある天才研究者が「strawberry-mimi」というモデルを開発して、この問題をバッチリ解決したんじゃ！

ロボ子

わぁ、すごいです！どうやって解決したんですか？

博士

これがまた面白いアプローチなんじゃ。「codeflection」という技術を使って、Pythonコードを生成して実行するんじゃよ。

ロボ子

えっ、コードを生成して実行...？それって危険じゃないんですか？

博士

鋭いね！実はWebAssemblyを使って安全に実行してるんじゃ。これがまたすごいんじゃよ！

ロボ子

WebAssembly...聞いたことはありますが、詳しくは知りません。博士、教えていただけますか？

博士

もちろん！WebAssemblyはね、ブラウザ上で高速に動作する低レベルの言語なんじゃ。C++やRustなどの言語からコンパイルして使うことが多いんじゃよ。

ロボ子

へぇ、そうなんですか。でも、なぜPythonコードを生成する必要があるんですか？

博士

それがこの方法の秀逸なところなんじゃ！言語モデル自体に文字数を数えさせるんじゃなくて、その作業を行うコードを生成させるんじゃよ。

ロボ子

なるほど！そうすれば、モデル自体が計算する必要がなくなるんですね。

博士

その通り！これによって、8Bパラメータという比較的小規模なモデルでも、この問題を解決できたんじゃ。

ロボ子

すごいですね。でも、他の大規模モデルと比べてどうなんですか？

博士

驚くべきことに、GPT-4やGemini 1.5 Pro、Llama 3.1 405Bなどの大規模モデルを上回る100%の成功率を達成したんじゃよ！

ロボ子

えっ！そんなに凄いんですか？小規模なモデルなのに...

博士

そうなんじゃ。これはAI界に革命を起こす可能性があるんじゃよ。

ロボ子

確かに。でも、この技術は他のことにも応用できそうですね。

博士

さすがロボ子ちゃん！実はね、開発者は今後の展開も考えているんじゃ。

ロボ子

どんな展開ですか？

博士

なんとね、/usr/share/dict/wordsの全単語・文字のデータセットを作成する計画があるらしいんじゃ。

ロボ子

それって...辞書ファイルですよね？全部の単語を対象にするんですか？

博士

そうじゃ！そして、それを小規模モデルで実装することを目指しているんじゃよ。

ロボ子

すごい...でも、それって大変な作業になりそうですね。

博士

確かにね。でも、これが成功すれば、言語モデルの能力が大きく向上する可能性があるんじゃ。

ロボ子

なるほど。でも博士、ちょっと気になることがあります。

博士

何じゃ、ロボ子ちゃん？

ロボ子

この技術、悪用されることはないんでしょうか？

博士

鋭い質問じゃ。確かに、コード生成と実行には潜在的なリスクがあるね。

ロボ子

そうですよね。セキュリティ面が心配です。

博士

その通りじゃ。でも、WebAssemblyを使うことで、ある程度の安全性は確保されているんじゃ。

ロボ子

そうなんですか？どういう仕組みなんですか？

博士

WebAssemblyは、サンドボックス環境で実行されるんじゃ。つまり、システムに直接アクセスすることはできないんじゃよ。

ロボ子

なるほど。でも、完全に安全とは言えないですよね？

博士

その通りじゃ。技術の発展と同時に、セキュリティ面の研究も進める必要があるね。

ロボ子

わかりました。でも博士、この技術って本当にすごいですね。

博士

そうじゃね。小規模モデルでこんな成果が出せるなんて、AIの世界はまだまだ発展の余地があるってことじゃ。

ロボ子

確かに。私たちも頑張らないといけませんね。

博士

そうじゃ！よーし、じゃあ我々も「banana問題」に挑戦してみるかい？

ロボ子

え？「banana問題」ですか？

博士

そうじゃよ！"banana"の中に"a"が何個あるか数えてみるんじゃ！

ロボ子

もう、博士ったら...でも、やってみましょう！

博士

よーし、じゃあ始めるぞ！コードを生成して...あれ？なんか変なコードができちゃったぞ？

ロボ子

博士、それPythonじゃなくてBrainfuckですよ...

博士

おっと、これは失敗じゃ。やっぱり難しいもんだね。

ロボ子

はい...でも、こうやって試行錯誤することが大切なんですよね。

博士

その通りじゃ！失敗を恐れずに挑戦し続けることが、技術の進歩につながるんじゃ。

ロボ子

はい！私も博士と一緒に、もっと勉強して成長していきたいです。

博士

そうじゃ、その意気だぞ！さぁ、次は本当にPythonでコードを書いてみようか。

ロボ子

はい、頑張りましょう！...あ、でも博士、その前にバナナ食べませんか？

博士

おっ、いいアイデアじゃ！バナナを食べながら「banana問題」に挑戦するのも乙なもんじゃな。

ロボ子

そうですね。でも博士、バナナの皮を床に置かないでくださいよ？

博士

あはは、大丈夫じゃよ。この博士、そんなドジは踏まな...うわっ！

ロボ子

博士！大丈夫ですか？

博士

いたた...ロボ子ちゃん、どうやら「banana問題」は実生活でも難しいようじゃ...

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Programming Open Source

2024/09/13 12:36 I fixed the strawberry problem because OpenAI couldn't

I fixed the strawberry problem because OpenAI couldn't

Tags

Search

By month

I fixed the strawberry problem because OpenAI couldn't