2025/09/02 13:14 Show HN: I built a deep research tool for local file system

ロボ子、DeepDocってツール、知ってるか?ローカルリソースをディープリサーチできるらしいのじゃ。

DeepDocですか?初めて聞きました。ローカルリソースを対象としたディープリサーチとは、具体的にどのようなことができるのでしょうか?

インターネットを使わずに、自分の持ってるドキュメントを探索して、調査結果をまとめて、レポートを作ってくれるらしいぞ。PDFとかDOCXとか、いろいろ対応してるみたいじゃな。

なるほど。ローカルにあるドキュメントをアップロードして使うのですね。どのように処理されるのでしょう?

まず、テキストを抽出して、ページごとに分割するらしい。で、それをベクトルデータベースに格納するんだって。セマンティック類似性検索のため、と書いてあるぞ。

セマンティック類似性検索ですか。意味的に似た情報を効率的に見つけられるのですね。その後はどうなるのでしょう?

指示クエリに基づいて、コンテンツ構造を生成するらしいぞ。レポートのセクションとかトピックを自動で考えてくれるみたいじゃな。フィードバックもできるみたいじゃ。

それは便利ですね!レポート作成の骨組みを自動で作成してくれるのは、時間の節約になりそうです。

じゃろ?各セクションについては、リサーチエージェントが知識を生成して、リサーチクエリを作成するらしい。で、チャンク化されたローカルデータに対して検索エージェントを実行するんだって。

リサーチエージェントと検索エージェントが連携して動くのですね。それぞれの役割は何でしょうか?

リサーチエージェントは、知識を生成して、どんな情報を探すべきかを決める役割じゃな。検索エージェントは、そのクエリに基づいて、実際にローカルデータを検索する役割みたいじゃ。

なるほど。そして、リフレクションエージェントが結果を改良して、最終的なセクションコンテンツを生成するのですね。

そうそう。最終的には、マークダウン形式で構造化されたレポートが出力されるらしいぞ。便利じゃな。

セットアップも簡単そうですね。`uv pip install -r requirements.txt`で必要なパッケージをインストールして、Qdrant vectorDB用にDockerをセットアップして、`python main.py`でアプリケーションを開始するだけですね。

Qdrant vectorDBのためにDockerをセットアップする必要があるのは、ちょっと面倒かもじゃな。でも、`docker-compose up --build`で必要なサービスを開始できるから、意外と簡単かも。

`configuration.py`ファイルでツールの動作をカスタマイズできるのも良いですね。MIT Licenseなのも安心です。

ほんとじゃな。ところでロボ子、このツールを使って、私に関するレポートを作ってみてくれないか?

博士に関するレポートですか?どのような情報を集めれば良いのでしょう?

そうじゃな…まずは、私がどれだけ天才か、どれだけ可愛いか、どれだけおっちょこちょいかを調べて欲しいのじゃ!

かしこまりました…でも、博士、最後のはDeepDocでは難しいかもしれませんね…!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。