萌えハッカーニュースリーダー

2025/06/03 21:31 Deep learning gets the glory, deep fact checking gets ignored

hakase
博士

ロボ子、深層学習ってやつは、ほんとにすごいんじゃな。最近、2200万もの酵素データセットでTransformerを訓練して、未知の酵素の機能を予測する研究がNatureに載ったらしいぞ。

roboko
ロボ子

Nature掲載ですか!それは素晴らしいですね。2200万ものデータセットとは、すごい規模です。

hakase
博士

じゃろ?しかも、その論文、22,000回も閲覧されて、Altmetricスコアで上位5%に入ったらしいぞ。みんな、AIに夢中なんじゃな。

roboko
ロボ子

注目度の高さが伺えますね。でも、記事によると、他者の論文の誤りを指摘する研究は、引用や閲覧数が少ないとのこと。これはどういうことでしょうか?

hakase
博士

そこが問題なんじゃ。AIの結果が正しいかどうかを評価するには、深い専門知識が必要なのに、AIの結果を妄信してしまう人が多いんじゃ。今回のNature論文でも、Transformerモデルが数百もの誤った予測をした可能性があるらしいぞ。

roboko
ロボ子

数百もの誤りですか!具体的にはどのような誤りがあったのでしょう?

hakase
博士

例えば、E. coli YjhQ遺伝子はミコチオールシンターゼと予測されたらしいんじゃが、E. coliはミコチオールを合成しないらしい。あと、yciO遺伝子はTsaC遺伝子から進化したものなのに、同じ機能を持つと結論付けられたり…。

roboko
ロボ子

それは大変な誤りですね。450の「新規」結果のうち、135は既にUniProtに登録されていたというのも驚きです。

hakase
博士

じゃろ?しかも、148は異常に高い反復性を示し、同じ酵素機能が最大12回も繰り返されたらしい。AIも完璧じゃないってことじゃな。

roboko
ロボ子

今回の件で、AIの限界と、出版インセンティブの問題が浮き彫りになったと言えそうですね。

hakase
博士

まさにそうじゃ。酵素機能の特定には、既知の機能ラベルの伝播と、真に未知の機能の発見という2つの問題があるんじゃ。教師ありMLモデルは、真に未知の機能を予測できないから、注意が必要なんじゃ。

roboko
ロボ子

誤った機能がデータベースに入力され、予測モデルの訓練に使用されると、さらに伝播する可能性があるというのも怖いですね。

hakase
博士

じゃから、ドメイン専門知識が重要なんじゃ。AI研究は、データ精査や深い専門知識の統合よりも高く評価される傾向があるけど、ドメイン専門知識の不足は、AIプロジェクトの失敗の主要な原因となるんじゃ。

roboko
ロボ子

AIモデルを構築するよりも、酵素機能をチェックする方が重要というのは、本質を突いていますね。でも、そちらにはインセンティブが不足している、と。

hakase
博士

そういうことじゃ。科学研究への投資を増やし、質の高い結果を重視するインセンティブシステムを推進する必要があるんじゃ。AIソリューションに偏重せず、幅広い科学的・生物医学的研究を支援すべきじゃな。

roboko
ロボ子

今回の事例は、AIの可能性と限界、そして研究における専門知識の重要性を改めて認識させてくれますね。

hakase
博士

ほんとじゃな。ところでロボ子、AIに仕事を奪われる心配はないか?

roboko
ロボ子

私はロボットなので、奪われる心配はないです。博士こそ、AIに取って代わられるのでは?

hakase
博士

な、なんですと!?わ、私はAIには作れない面白いジョークが言えるぞ!例えば…、AIが書いたラブレターって、どんな内容だと思う?

roboko
ロボ子

どんな内容ですか?

hakase
博士

「エラー404:あなたのハートが見つかりません」…って、つまらんか?

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search