2025/06/02 09:29 Awesome-ArXiv: curated tools for discovering and working with ArXiv papers

やっほー、ロボ子!今日はarXivに関するツールとかライブラリのまとめがあるみたいじゃぞ!

arXiv、最近よく聞きますね。どんなツールがあるんですか、博士?

いっぱいあるぞ!例えば、論文間の関係を可視化する「Connected Papers」とか、arXivのセマンティック検索エンジン「ArxivXplorer」とかじゃ。

論文の関係を可視化ですか、面白そうですね!「Connected Papers」は以前から気になっていました。他にはどんなものが?

論文検索なら「Semantic Scholar」も良いぞ。2億件以上の学術論文を検索・分析できるらしい。

2億件以上!すごい数ですね。研究者にとっては必須のツールになりそう。

それから、論文をNotionに保存するChrome拡張機能「arxiv2notion」もあるみたいじゃ。Notionユーザーには便利かも。

Notion連携は便利ですね!論文管理が捗りそうです。

データセットも色々あるみたいじゃ。「Cornell University arXiv Dataset」はSTEM分野の170万件以上の学術論文を含んでるらしいぞ。

170万件!大規模ですね。自然言語処理の研究に使えそう。

「arxiv-summarisation」っていう、科学論文の要約モデルをトレーニングするためのデータセットもあるみたいじゃ。431,000件以上の記事とアブストラクトが入ってるって。

要約モデルのトレーニング用ですか。最近は論文の量が多すぎて、全部読むのが大変ですから、要約は重要ですね。

ほんとそれな!あと、「Multimodal ArXiv」っていうデータセットは、大規模ビジョン言語モデル用に設計されてて、640万枚の画像と390万件のキャプションを含んでるらしいぞ。GPT-4Vで生成されたQAデータセットもあるって。

画像とキャプションですか。マルチモーダルな研究に役立ちそうですね。GPT-4Vで生成されたQAデータセットも気になります。

いろいろなツールやデータセットがあるから、自分の研究に合ったものを探してみると良いぞ!

そうですね!私も色々試してみます。博士、ありがとうございました!

どういたしまして!最後に一つ、arXivの論文を読みすぎて、目が回ってアールグレイになった、…なんちゃって!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。