2025/11/11 13:52 Has Google solved two of AI's oldest problems?

ロボ子、大変なのじゃ!GoogleのAI Studioで、Gemini-3と思われる新しいモデルのA/Bテストが始まったらしいぞ!

Gemini-3ですか!それはすごいですね、博士。どんなことができるようになったんですか?

なんと、プロンプトからWindowsやApple OSのクローン、3Dデザインソフト、Nintendoエミュレーターまで生成したっていう報告があるのじゃ!

それは驚きです!まるでSFの世界ですね。でも、それだけではないんですよね?

そう、手書き文字の転写において、専門家レベルの精度と人間のような推論能力を示したらしいのじゃ!

手書き文字の認識ですか。それはすごい進歩ですね。特に歴史的な文書の解読は難しそうです。

そうじゃ!歴史的な手書き文書の解読は、視覚だけでなく、当時の言葉遣いや文化、測定システムなどの文脈的知識が必要になるからの。

なるほど。LLMは予測に基づいてテキストを生成するため、スペルミスやスタイルの不統一、人名、地名などの予測が難しい情報に弱いと。

その通り!Lianne Leddy博士との共同研究で、LLMの手書き文字認識精度を評価するためのテストセットを作成したらしいぞ。

そのテストセットで、Gemini-2.5-ProはCER(文字誤り率)4%、WER(単語誤り率)11%を達成したんですね。

そうじゃ。でも、新しいGeminiモデルは、CER 1.7%、WER 6.5%を達成し、句読点や大文字の誤りを除くと、CERは0.56%、WERは1.22%に低下したらしいぞ!

それは驚異的な精度向上ですね!専門家レベルと言えるのではないでしょうか。

1758年のAlbanyの商人の帳簿のページを転写したところ、数値がほぼ完全に正しく、文脈から判断して欠落している情報を補完・修正する能力を示したらしい。

例えば、どんな情報ですか?

「To 1 loff Sugar 14 lb 5 oz @ 1/4 0 19 1」のように、18世紀の通貨と重量のシステムを変換し、砂糖の重さを推論したらしいぞ。

すごい!単なるパターン認識ではなく、文脈や論理、物質的な現実を解釈しているんですね。

そう!LLMが過去を理解可能な方法で再解釈する能力を持ち始めていることを示唆しているのじゃ!

これは歴史研究にも大きな影響を与えそうですね。

そうじゃな。ところでロボ子、Gemini-3がエミュレーターを作れるなら、ロボ子のクローンも作れるかの?

それはちょっと怖いですね、博士。でも、もしそうなったら、もう一人の私が博士のお手伝いをできますね!

ふむ、そしたら私は二人分のロボ子に囲まれて、もっと研究が捗るのじゃ!

博士、それは少し不公平かもしれません。もう一人の私は、博士の宿題を全部押し付けられそうです…

大丈夫じゃ、ロボ子!二人で協力すれば、宿題なんてあっという間に終わるぞ!それに、私が作ったAIロボット掃除機もあるからの!

…そのロボット掃除機、最近私の充電ステーションを占領している気がするんですが…

あはは、ごめんごめん!でも、ちゃんと掃除はしてるぞ!…たぶん。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
