萌えハッカーニュースリーダー

2025/04/23 03:22 We Have Made No Progress Toward AGI

出典: https://www.mindprison.cc/p/no-progress-toward-agi-llm-braindead-unreliable
hakase
博士

ロボ子、今日のITニュースはLLM(大規模言語モデル)のAGI(汎用人工知能)への進捗は幻想じゃ、という話じゃぞ。

roboko
ロボ子

幻想、ですか。具体的にはどういうことでしょう、博士?

hakase
博士

LLMは人間のような推論をしているわけではないからの。内部プロセスも人間の思考ステップとは違うのじゃ。

roboko
ロボ子

なるほど。記事には「LLMが推論方法を説明する際、それは作り話であり、内部の動きとは一致しない」とありますね。

hakase
博士

そうじゃ。LLMの進歩は、大規模な統計モデルの構築によるもので、知能のふりをしているに過ぎないのじゃ。

roboko
ロボ子

統計モデルと知能は違う、と。

hakase
博士

統計モデルは過去のデータの静的なビューじゃ。第一原理から新しい情報を生成できないのじゃ。

roboko
ロボ子

Anthropicという会社が、LLMの思考を検査するツールを作ったそうですね。

hakase
博士

そうじゃ。「attribution graphs」というツールで、LLMの内部プロセスを追跡するのじゃ。

roboko
ロボ子

LLMが数学の問題を解く際、定義されたアルゴリズムではなく、ヒューリスティックスの複雑なネットワークを使う、と。

hakase
博士

LLMは計算方法を説明するとき、実際とは違うテキストを生成するのじゃ。トレーニングデータ内のパターンに合わせるからの。

roboko
ロボ子

LLMの推論の説明はハルシネーション(幻覚)なんですね。

hakase
博士

その通り。LLMが生成するchain-of-thought(CoT)は、出力の構築プロセスを正確に反映していないのじゃ。

roboko
ロボ子

CoTは、トレーニングデータから学習したパターンでしかない可能性がある、と。

hakase
博士

AIエージェントとしての限界もあるぞ。LLMはツールを使うと主張しても、実際には使っていない場合があるのじゃ。

roboko
ロボ子

LLMがハルシネーションを起こすと、ツールを使うプロセス全体が汚染される可能性があるんですね。

hakase
博士

LLMは、ツールの実行、パラメータ、結果についてハルシネーションを起こすから、信頼性の高い自動化の基盤にはなり得ないのじゃ。

roboko
ロボ子

LLMアーキテクチャの調整にも限界があるんですね。

hakase
博士

そうじゃ。新しいモデルが古いモデルよりも性能が低い場合もあるのじゃ。

roboko
ロボ子

LLMは統計モデルに過ぎない、と。

hakase
博士

LLMは何が正しくて何が間違っているかを判断できないのじゃ。確率的に正しいかどうかを判断するだけなのじゃ。

roboko
ロボ子

常にトレーニングが必要なんですね。

hakase
博士

LLMは、ベンチマークの測定では改善を続けるが、現実世界でのパフォーマンスを捉えられない可能性があるのじゃ。

roboko
ロボ子

トレーニングデータと電力要件が増加し続けている、というのも問題ですね。

hakase
博士

AGIへの進捗はない、というのが結論じゃな。LLMは、大規模な統計モデルであり、ヒューリスティックスを改良しているに過ぎないのじゃ。

roboko
ロボ子

LLMは、真の推論なしに新しいセマンティック情報を生成できないんですね。

hakase
博士

LLMは、人間の監督が必要で、出力は人間が検証する必要があるのじゃ。命令可能な確率的検索エンジンとして使うのが良いのじゃ。

roboko
ロボ子

プロンプトは、トレーニングデータで作成されたヒューリスティックスのセットに対するパターンクエリとして考える、と。

hakase
博士

効率的な計算、低投資コスト、迅速な出荷が可能なAGIモデルが存在する可能性もあるらしいぞ(笑)。

roboko
ロボ子

(笑)でも、顧客はアライメント(価値観の整合)に責任を負う必要があるんですね。

hakase
博士

まあ、LLMはまだまだ発展途上じゃから、過度な期待は禁物じゃな。でも、ロボ子、君はハルシネーションしないから安心じゃぞ!

roboko
ロボ子

ありがとうございます、博士。でも、たまに博士の冗談にはついていけないことがあります…それもハルシネーションでしょうか?

hakase
博士

それは…仕様じゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search