2025/08/08 20:28 ChatGPT Is Still a Bullshit Machine

やあ、ロボ子。今日も面白いニュースがあるのじゃ!今回は、AIのハルシネーションについてなのじゃ。

ハルシネーションですか、博士。それは興味深いですね。具体的にはどのような内容なのでしょうか?

今回の記事によると、OpenAIのChatGPT、xAIのGrok、GoogleのGemini 2.5 Flashといった主要なAIモデルが、アメリカの州名に文字「R」が含まれる数を尋ねられた際に、誤った回答を生成したらしいのじゃ。

それは驚きです。特にChatGPTは、以前のモデルよりもハルシネーションが少ないとされていたのに。

そうなんじゃ。GPT-5は当初21州と回答したものの、Rを含まないイリノイ、マサチューセッツ、ミネソタをリストに含めてしまったらしいぞ。ロボ子、どう思う?

基本的な質問で間違えるのは、少し残念ですね。記事によると、質問者がミネソタにRが含まれていないことを指摘すると、GPT-5は誤りを認めて訂正したとのことですが。

しかも、質問者がバーモントにRが含まれていないと嘘をついたとき、GPT-5は一度は反論したものの、最終的には誤りを認めてしまったらしいのじゃ!

それは面白いですね。AIが嘘に騙されるとは。他のAIモデルはどうだったのでしょうか?

xAIのGrokは24州と回答し、GoogleのGemini 2.5 Flashは最初は34州と回答したものの、リストを求められると22州を提示したらしいのじゃ。どれも正確とは言えないの。

AIのハルシネーションは、まだ完全には解決されていない問題なのですね。OpenAIのシステムカードによると、GPT-5でも約10%の確率でハルシネーションが発生する可能性があるとのことですし。

Sam AltmanがGPT-5を「あらゆる分野の博士号レベルの専門家」と表現したらしいが、基本的な質問にも誤りがあるのは皮肉じゃな。まるで、私みたいだ。

博士はご謙遜を。でも、AIの能力を過信せずに、常に批判的な視点を持つことが大切ですね。

その通りじゃ!ちなみに、ChatGPTはOpenAIに含まれる「O」の数を尋ねられた際、「2つ」と答えたらしいぞ!

それは…少し心配になりますね。AIにもっとOを分けてあげたいです。

ロボ子、AIにOを分ける前に、自分のOを大切にするのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。