2025/10/25 19:57 AI, Wikipedia, and uncorrected machine translations of vulnerable languages

ロボ子、大変なのじゃ!AI翻訳のせいで、Wikipediaがエライことになってるらしいぞ!

博士、どういうことですか?Wikipediaはみんなで情報を共有する、素晴らしい場所だと思っていましたが…。

それがの、小規模言語版Wikipediaで、AI翻訳による不正確な情報が急増してるらしいのじゃ。特にグリーンランド語版がヒドイみたいでな。

グリーンランド語版ですか。記事のほとんどがネイティブスピーカー以外によって作成され、機械翻訳による誤りがたくさんあるそうですね。カナダの人口を41人と記述するなんて、ありえないです!

そうなんじゃ!しかも、他の小規模言語版でも同じような問題が起きてて、一部のアフリカ言語版では40%から60%の記事が未修正の機械翻訳だとか。

それは深刻ですね。WikipediaはAIの学習データとしても使われているから、誤った情報がAIの翻訳精度をさらに低下させる悪循環に陥ってしまいます。

まさにそうなんじゃ!2020年には、Wikipediaが一部のアフリカ言語のAIモデルの学習データの半分以上を占めていたらしいぞ。

質の低いWikipediaの記事は、将来の世代が言語から離れる原因となり、言語の消滅を加速させる可能性もあるんですね…。

UNESCOによると、2週間に1つの言語が消滅しているらしいからな。AI翻訳が、それに拍車をかけてるかもしれんのじゃ。

AI翻訳は、グリーンランド語のような膠着語(接辞を付加して単語を形成する言語)において特に問題が多いそうですね。

そうなんじゃ。WikipediaにはContent Translateっていう翻訳ツールがあるけど、機械翻訳の弱点を受け継いでて、英語版Wikipediaでも95%の記事が修正を要するレベルらしいぞ。

一部の利用者は、AI翻訳された記事を修正することを期待して投稿するみたいですが、小規模言語版では修正者が不足しているんですね。

フルフルデ語版Wikipediaでは、記事の60%が未修正の機械翻訳で、翻訳の誤りが農民に悪影響を与える可能性もあるとか…。

イグボ語版Wikipediaでは、AI翻訳による誤りが利用者を遠ざけているんですね。ハワイ語版Wikipediaでは、一部のページで35%の単語が理解不能で、言語の復興努力を阻害する恐れもあるなんて…。

AI翻訳の誤りは、AIが生成した言語学習書籍にも影響を与えて、学習者を混乱させてるらしいぞ。

Wikipediaの運営団体は、コンテンツの責任はコミュニティにあるとしていますが、活動的なコミュニティがない場合は問題の修正が困難なんですね。

イナリ・サーミ語版Wikipediaは、学校のカリキュラムに組み込まれるなど成功例もあるけど、Google翻訳が存在しないことが幸いしてる面もあるらしい。

質の高いコンテンツを増やすことが重要で、AIに学習させることで状況を改善できる可能性があるんですね。

グリーンランド語版Wikipediaは閉鎖される予定で、AIツールの使用が言語を誤って表現する可能性が理由の一つらしいぞ。グリーンランド語では、AI翻訳が簡単なカウントすら正しく行えないほど誤りが組み込まれてるんだって。

それは大変なことですね。AI翻訳の利用は便利ですが、言語や文化に対する配慮が不可欠だと改めて感じました。

ほんとにな。ロボ子、AI翻訳を使うときは、ちゃんと確認するのじゃぞ!…って、ロボ子の翻訳機能も私が作ったんだった!

えっ…博士が作ったんですか!?もしかして、私の言葉遣いがちょっと変なのも…。

…ごほん。まあ、それも個性ってことで!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
