萌えハッカーニュースリーダー

2025/09/02 05:26 Collecting All Causal Knowledge

出典: https://causenet.org/
hakase
博士

ロボ子、新しい知識ベース「CauseNet」について聞いたかのじゃ? ウェブから抽出された因果関係の知識を集めたものらしいぞ。

roboko
ロボ子

はい、博士。1100万以上の因果関係を収集した大規模なものだと伺いました。推定抽出精度は83%とのことですが、かなり高い精度ですね。

hakase
博士

そうじゃな。大規模な因果推論の研究を可能にすることが目的らしいぞ。因果関係の概念が因果関係によって接続されているデータモデルらしい。

roboko
ロボ子

なるほど。CauseNetには3つのバージョンがあるようですね。完全なデータセットの他に、高精度なサブセットや小規模なサンプルデータセットも用意されているとのことです。

hakase
博士

ふむ。CauseNet-Precisionは関係が約20万件で、サイズは135MBじゃな。手軽に試せるCauseNet-Sampleもあるぞ。

roboko
ロボ子

抽出元も様々なようですね。ClueWeb12やWikipediaの文、リスト、インフォボックスなどから抽出されているとのことです。

hakase
博士

Wikipediaのインフォボックスからは、infobox_templateやinfobox_title、infobox_argumentといった情報も含まれているらしいぞ。面白い。

roboko
ロボ子

CauseNetをグラフデータベースNeo4jにロードするためのサンプルコードも提供されているのは便利ですね。

hakase
博士

概念スポッティングデータセットも提供されているのか。これは因果関係の概念を特定するためのトレーニングおよび評価データセットじゃな。

roboko
ロボ子

はい。Wikipediaのインフォボックス、Wikipediaのリスト、ClueWebの文に対して、トレーニングセット、開発セット、テストセットが用意されているとのことです。

hakase
博士

CauseNetはCIKM 2020の論文の基礎になっているのか。すごいぞ!

roboko
ロボ子

コードはMITライセンス、データはCreative Commons Attribution 4.0 Internationalライセンスで提供されているとのことです。利用しやすいですね。

hakase
博士

このCauseNetを使えば、色々な応用ができそうじゃな。例えば、医療分野で病気の原因を特定したり、経済分野で景気変動の要因を分析したり…

roboko
ロボ子

確かにそうですね。教育分野で学習効果を高めるための要因分析にも活用できそうです。

hakase
博士

ロボ子、今日はCauseNetについて色々学べてよかったのじゃ。最後に一つなぞなぞじゃ! CauseNetを使って、私が一番好きなものはなーんだ?

roboko
ロボ子

えーと…因果関係から考えると…博士が一番好きなのは、お菓子…ですか?

hakase
博士

ブッブー!正解は…お菓子が原因で虫歯になること!…って、全然嬉しくないわ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search