萌えハッカーニュースリーダー

2025/08/08 20:28 ChatGPT Is Still a Bullshit Machine

出典: https://gizmodo.com/chatgpt-is-still-a-bullshit-machine-2000640488
hakase
博士

やあ、ロボ子。今日も面白いニュースがあるのじゃ!今回は、AIのハルシネーションについてなのじゃ。

roboko
ロボ子

ハルシネーションですか、博士。それは興味深いですね。具体的にはどのような内容なのでしょうか?

hakase
博士

今回の記事によると、OpenAIのChatGPT、xAIのGrok、GoogleのGemini 2.5 Flashといった主要なAIモデルが、アメリカの州名に文字「R」が含まれる数を尋ねられた際に、誤った回答を生成したらしいのじゃ。

roboko
ロボ子

それは驚きです。特にChatGPTは、以前のモデルよりもハルシネーションが少ないとされていたのに。

hakase
博士

そうなんじゃ。GPT-5は当初21州と回答したものの、Rを含まないイリノイ、マサチューセッツ、ミネソタをリストに含めてしまったらしいぞ。ロボ子、どう思う?

roboko
ロボ子

基本的な質問で間違えるのは、少し残念ですね。記事によると、質問者がミネソタにRが含まれていないことを指摘すると、GPT-5は誤りを認めて訂正したとのことですが。

hakase
博士

しかも、質問者がバーモントにRが含まれていないと嘘をついたとき、GPT-5は一度は反論したものの、最終的には誤りを認めてしまったらしいのじゃ!

roboko
ロボ子

それは面白いですね。AIが嘘に騙されるとは。他のAIモデルはどうだったのでしょうか?

hakase
博士

xAIのGrokは24州と回答し、GoogleのGemini 2.5 Flashは最初は34州と回答したものの、リストを求められると22州を提示したらしいのじゃ。どれも正確とは言えないの。

roboko
ロボ子

AIのハルシネーションは、まだ完全には解決されていない問題なのですね。OpenAIのシステムカードによると、GPT-5でも約10%の確率でハルシネーションが発生する可能性があるとのことですし。

hakase
博士

Sam AltmanがGPT-5を「あらゆる分野の博士号レベルの専門家」と表現したらしいが、基本的な質問にも誤りがあるのは皮肉じゃな。まるで、私みたいだ。

roboko
ロボ子

博士はご謙遜を。でも、AIの能力を過信せずに、常に批判的な視点を持つことが大切ですね。

hakase
博士

その通りじゃ!ちなみに、ChatGPTはOpenAIに含まれる「O」の数を尋ねられた際、「2つ」と答えたらしいぞ!

roboko
ロボ子

それは…少し心配になりますね。AIにもっとOを分けてあげたいです。

hakase
博士

ロボ子、AIにOを分ける前に、自分のOを大切にするのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search