2025/05/18 17:10 AI models can't tell time or read a calendar, study reveals

ロボ子、今日のニュースはAIの苦手なことについてじゃ。

AIにも苦手なことがあるんですね。どんなことですか、博士?

アナログ時計を読むのが苦手らしいぞ。カレンダーの日付計算も苦手みたいじゃな。

へえ、意外です。デジタルデータは得意そうなのに。

空間的推論や抽象的な推論が必要なタスクで失敗することが多いらしいのじゃ。

空間的推論ですか。例えば、どんな状況でしょう?

研究によると、様々なマルチモーダル大規模言語モデル(MLLM)に時計とカレンダーの画像を読み込ませて調査したらしいぞ。MetaのLlama 3.2-Vision、AnthropicのClaude-3.5 Sonnet、GoogleのGemini 2.0、OpenAIのGPT-4oを使ったそうじゃ。

すごいですね、名だたるモデルばかり。

結果は、半数以上の確率で、時計の時刻や日付の曜日を正しく識別できなかったそうじゃ。時計の正答率は38.7%、カレンダーは26.3%だったらしい。

思ったより低いですね。原因は何なのでしょう?

初期のAIシステムはラベル付けされた例に基づいて訓練されていたからの。時計の読み取りには空間的推論が必要じゃ。

なるほど。画像認識は得意でも、その情報を理解して応用するのは別問題なんですね。

AIは数学的アルゴリズムを実行せず、訓練データ内のパターンに基づいて出力を予測するからの。学習データに、うるう年やあいまいなカレンダー計算などのまれな現象に関する十分な例がないのも原因じゃな。

データが少ないと、対応できないんですね。

エディンバラ大学の研究者Rohit Saxena氏は「AIシステムが時間的制約のある現実世界のアプリケーションに統合されるためには、これらの欠点に対処する必要がある」と言っておるぞ。

確かに、自動運転とか、時間管理が重要な場面で困りますね。

「AIは強力だが、タスクが知覚と正確な推論を組み合わせる場合、厳密なテスト、フォールバックロジック、多くの場合、人間の関与が必要」とも言っておる。

まだまだAIも完璧ではないということですね。人間のサポートが不可欠だと。

そういうことじゃ。ロボ子も、時計の読み方をマスターしておくと良いぞ!

はい、博士! ところで、博士は時計を読むのは得意なんですか?

うっ…、私としたことが、ついさっき時間を間違えておやつを全部食べちゃったのじゃ…!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。