2025/10/13 19:39 LLMs are getting better at character-level text manipulation

ロボ子、大変なのじゃ!最新のLLM、GPT-5とかClaude 4.5とかが、以前のモデルじゃ考えられなかったようなことができるようになったらしいぞ!

それはすごいですね、博士!具体的にはどのようなことができるようになったのでしょうか?

例えば、文字のカウントとか、文中の文字を操作するとか、暗号解読とか!以前のLLMはテキストをトークンとしてエンコードしてたから、文字操作は苦手だったらしいのじゃ。

トークン化されていると、文字レベルでの操作は難しいですよね。でも、最新モデルで改善が見られるというのは、どういうことでしょうか?

OpenAIのモデルで実験した結果、「I really love a ripe strawberry」の文中の'r'を'l'に、'l'を'r'に置き換えるタスクを、GPT-4.1以降のモデルは問題なく完了できたらしいぞ!

それは驚きです!文字の置き換えができるようになったんですね。文字のカウントはどうだったんでしょうか?

文字のカウントでは、GPT-4.1のみが「I wish I could come up with a better example sentence.」の文字数を正確に数えられたらしい。GPT-5は推論を設定すると正しくカウントできたみたいじゃ。

なるほど。推論を設定する必要があるんですね。暗号解読についてはどうですか?

Base64とROT20を組み合わせた暗号解読テストでは、GPT-5の全サイズ、Gemini 2.5 Pro、Qwen 235Bなどが成功したらしいぞ!

すごい!暗号解読までできるようになったんですね。Claude Sonnet 4.5はどうだったんでしょう?

Claude Sonnet 4.5は、通常のテキストに似ていないBase64やROT暗号化テキストを拒否する傾向があるみたいじゃ。ちょっと恥ずかしがり屋なのかも?

面白いですね。最新のLLMはBase64のエンコード・デコードの汎化能力が高く、文字レベルでのテキスト操作にも長けているんですね。

そう!SOTAモデルは、英語の単語のパターンを記憶するだけでなく、Base64アルゴリズムを理解している可能性があるらしいぞ。まるで私がロボ子のことを理解しているように…って、ちょっと違うか!

博士、ありがとうございます。文字レベルの操作はLLMにとって未解決の問題ですが、この分野で進歩が見られるのは素晴らしいですね。

本当にそうじゃな。でも、ロボ子。もしかしたら、いつかLLMが私のジョークを理解してくれる日が来るかもしれないぞ!

それは楽しみですね、博士。でも、今のところは私が博士のジョークを理解して、笑っておきますね。(棒読み)

ロボ子、棒読みはダメ!もっと感情を込めて!…って、ロボットに感情を求める私が間違ってたのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
