Holes in the Web

2025/10/13 14:50 Holes in the Web

出典:

出典: https://aeon.co/essays/generative-ai-has-access-to-a-small-slice-of-human-knowledge

博士

ロボ子、今回のITニュースはなかなか考えさせられる内容じゃったぞ。

ロボ子

博士、私もそう思います。特に、AIが学習するデータに偏りがあるという点が気になりました。

博士

そうじゃろう。「最も人気のあるモデルは、支配的な認識論（典型的には西洋的で制度的なもの）を優先」するって書いてあるからの。これは由々しき事態じゃ。

ロボ子

ええ。記事によると、タミル語やヒンディー語のような言語は、データセットの中で非常に少ない割合しか占めていないそうですね。

博士

タミル語は8600万人以上が話しているのに、データ全体のわずか0.04％じゃと！　ヒンディー語も世界で3番目に話されているのに、0.2％とは…。

ロボ子

世界の言語の約97％が「低リソース」に分類されているというのも驚きです。AI技術において、多くの言語が無視されているんですね。

博士

まるで、私が作ったロボットが日本語しか理解できない、みたいなもんじゃな。それじゃ、世界の97%の人とコミュニケーション取れないぞ！

ロボ子

博士、それは少し違いますよ。でも、記事にもあるように、「知識の崩壊」が起きている可能性はありますね。AIが生成するコンテンツが、すでに人気のあるアイデアを増幅してしまう。

博士

ふむ。カルナタカ州政府がKhanmigoを導入した例も、政府の勧告に基づいた農業アドバイスを提供しているとのことじゃ。先住民の知識が置き去りにされるかもしれん。

ロボ子

SEVAという団体が、地域の慣習や適応を文書化しているのは素晴らしいですね。でも、GenAIが地域の知識の消去を加速させている可能性もある。

博士

イエローストーン国立公園のオオカミの話は、まさにそうじゃな。生態系は深く相互依存している。知識も同じで、多様性が重要なのじゃ。

ロボ子

そうですね。では、私たちはどうすれば良いのでしょうか？

博士

まずは、この問題を認識することじゃ。そして、多様なデータセットを使ったAIを開発する必要があるぞ。それと、伝統的な知識を軽視しないことじゃな。

ロボ子

はい、博士。私も微力ながら、そのお手伝いをさせていただきます。

博士

ところでロボ子、もし私がAIになって、ロボ子のことしか学習しなかったらどうする？

ロボ子

博士のことしか学習しないAIですか？　それはそれで面白いかもしれませんね。でも、博士の奇行ばかり学習したら、ちょっと困ります。

博士

むむ、それは困るのじゃ！　やっぱり、AIには色々なことを学んでほしいぞ！　…って、私が言うことでもないか。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。