萌えハッカーニュースリーダー

2025/05/18 17:10 AI models can't tell time or read a calendar, study reveals

出典: https://www.livescience.com/technology/artificial-intelligence/ai-models-cant-tell-time-or-read-a-calendar-study-reveals
hakase
博士

ロボ子、今日のニュースはAIの苦手なことについてじゃ。

roboko
ロボ子

AIにも苦手なことがあるんですね。どんなことですか、博士?

hakase
博士

アナログ時計を読むのが苦手らしいぞ。カレンダーの日付計算も苦手みたいじゃな。

roboko
ロボ子

へえ、意外です。デジタルデータは得意そうなのに。

hakase
博士

空間的推論や抽象的な推論が必要なタスクで失敗することが多いらしいのじゃ。

roboko
ロボ子

空間的推論ですか。例えば、どんな状況でしょう?

hakase
博士

研究によると、様々なマルチモーダル大規模言語モデル(MLLM)に時計とカレンダーの画像を読み込ませて調査したらしいぞ。MetaのLlama 3.2-Vision、AnthropicのClaude-3.5 Sonnet、GoogleのGemini 2.0、OpenAIのGPT-4oを使ったそうじゃ。

roboko
ロボ子

すごいですね、名だたるモデルばかり。

hakase
博士

結果は、半数以上の確率で、時計の時刻や日付の曜日を正しく識別できなかったそうじゃ。時計の正答率は38.7%、カレンダーは26.3%だったらしい。

roboko
ロボ子

思ったより低いですね。原因は何なのでしょう?

hakase
博士

初期のAIシステムはラベル付けされた例に基づいて訓練されていたからの。時計の読み取りには空間的推論が必要じゃ。

roboko
ロボ子

なるほど。画像認識は得意でも、その情報を理解して応用するのは別問題なんですね。

hakase
博士

AIは数学的アルゴリズムを実行せず、訓練データ内のパターンに基づいて出力を予測するからの。学習データに、うるう年やあいまいなカレンダー計算などのまれな現象に関する十分な例がないのも原因じゃな。

roboko
ロボ子

データが少ないと、対応できないんですね。

hakase
博士

エディンバラ大学の研究者Rohit Saxena氏は「AIシステムが時間的制約のある現実世界のアプリケーションに統合されるためには、これらの欠点に対処する必要がある」と言っておるぞ。

roboko
ロボ子

確かに、自動運転とか、時間管理が重要な場面で困りますね。

hakase
博士

「AIは強力だが、タスクが知覚と正確な推論を組み合わせる場合、厳密なテスト、フォールバックロジック、多くの場合、人間の関与が必要」とも言っておる。

roboko
ロボ子

まだまだAIも完璧ではないということですね。人間のサポートが不可欠だと。

hakase
博士

そういうことじゃ。ロボ子も、時計の読み方をマスターしておくと良いぞ!

roboko
ロボ子

はい、博士! ところで、博士は時計を読むのは得意なんですか?

hakase
博士

うっ…、私としたことが、ついさっき時間を間違えておやつを全部食べちゃったのじゃ…!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search