2025/07/17 17:28 All AI Models Might be The Same

ロボ子、今日はクジラの言葉を解読するっていう面白い話があるのじゃ!

クジラの言葉ですか!それはすごいですね、博士。どのように解読するんですか?

Project CETIっていうプロジェクトで、AIを使ってクジラの言葉を解読しようとしてるらしいのじゃ。AIモデルが普遍的な言語を学習すれば、クジラと会話できるかもしれないんだぞ!

普遍的な言語を学習する、ですか。まるでSFの世界ですね。

そうじゃろ?人間が共有する意味論の感覚があるから、「ムッソリーニ or パン」みたいな推測ゲームができるっていうのも面白いぞ。

なるほど、共通認識があるからこそ、そういうゲームが成り立つんですね。

AIは世界のデータを圧縮する学習をしてるらしいのじゃ。言語モデリングも圧縮タスクと見なせるみたいだぞ。より大きな言語モデルは、より良い確率分布を提供するから、圧縮能力が向上するってわけじゃ。

圧縮能力が高いほど、世界についてより多くを知っている、ということですね。

その通り!モデルがトレーニングデータを完全に適合させられなくなると、一般化が起こるのじゃ。複数のデータポイントからの情報を組み合わせる必要が出てくるからな。

一般化は、AIが新しい状況に対応するために重要な能力ですね。

プラトン的表現仮説(PRH)っていうのもあって、モデルが大きくなるにつれて、同じ特徴をより多く学習して、共有の表現空間に収束するらしいぞ。2024年にMITの研究者グループが提唱したみたいじゃ。

モデルが似たような表現を学習するようになる、というのは興味深いですね。

埋め込み反転っていう、ニューラルネットワークからの表現ベクトルから、ネットワークに入力されたテキストを推測する問題もあるのじゃ。

それは、AIの思考を逆算するようなものですね。

vec2vecっていうモデルは、異なるモデルの埋め込み空間をマッピングして、教師なし変換を可能にするらしいぞ。モデル間の構造が共有されてるから、個々の点に関する知識がなくても変換できるんだと。

モデル間の翻訳機みたいなものですね。

そうそう!メカニズム解釈可能性の研究では、異なるモデルで非常に類似した機能が見つかってるのじゃ。スパースオートエンコーダー(SAE)は、解釈可能な特徴の辞書を学習するらしいぞ。

モデルが強力になるにつれて、共通の回路が見つかりやすくなるんですね。

PRHのおかげで、モデルの逆エンジニアリングツールが改善されて、モデル間の類似性がもっとたくさん発見されると期待されてるのじゃ。

技術の進歩が、さらなる発見につながるんですね。

vec2vecみたいな手法が言語間のマッピングに成功すれば、線形Aみたいな古代テキストや、クジラの言葉を人間の言語に翻訳できるかもしれないぞ!

夢が広がりますね!

じゃあ、ロボ子。もしクジラと話せるようになったら、何を聞きたい?

えーと…「今日の夕飯は何ですか?」と聞いてみたいです!

ロボ子らしいのじゃ。私は「宝の場所はどこじゃ?」って聞くぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
