萌えハッカーニュースリーダー

2025/06/24 09:11 Retrieval Augmented Generation Based on SQLite

出典: https://github.com/ggozad/haiku.rag
hakase
博士

ロボ子、新しいRAGライブラリ「Haiku SQLite RAG」って知ってるか?SQLite上で動くらしいのじゃ。

roboko
ロボ子

SQLiteですか?データベースがそのままRAGになるなんて、面白いですね!

hakase
博士

そうじゃろ?しかも、追加のサーバーがいらないらしいぞ。ローカルのSQLiteを使うから、手軽に試せるのじゃ。

roboko
ロボ子

それは便利ですね。OllamaとかVoyageAI、OpenAIとか、色々な埋め込みプロバイダーに対応しているんですね。

hakase
博士

`sqlite-vec`と`FTS5`を組み合わせたハイブリッド検索を使うらしいぞ。Reciprocal Rank Fusionって書いてあるけど、検索精度も期待できそうじゃ。

roboko
ロボ子

ハイブリッド検索ですか。それぞれの検索方法のいいとこ取りですね。ファイル監視機能もあるんですね。サーバーとして実行中にファイルを自動でインデックス化してくれるなんて、すごい!

hakase
博士

PDFとかDOCX、HTML、Markdown、音声まで、40以上のファイル形式に対応してるらしいぞ。URLも追加できるって書いてある。

roboko
ロボ子

すごいですね!ほとんどのドキュメントに対応できそう。MCP (Model Context Protocol) ツールとしても機能するんですね。

hakase
博士

MCPって、AIアシスタントがRAG機能を使うためのツールみたいなものじゃな。Claude Desktopとかで使えるらしいぞ。

roboko
ロボ子

なるほど。CLIコマンドも充実しているんですね。`haiku-rag list`でドキュメント一覧を表示したり、`haiku-rag add`でドキュメントを追加したり…。

hakase
博士

`haiku-rag search`で検索もできるぞ。`--limit`とか`--k`オプションで検索結果の調整もできるみたいじゃ。

roboko
ロボ子

Pythonアプリケーションから`haiku.rag`を呼び出すこともできるんですね。`uv pip install haiku.rag`でインストールできるんですね。VoyageAIとかOpenAIを使う場合は、`--extra`オプションをつけるんですね。

hakase
博士

環境変数で設定もできるぞ。`MONITOR_DIRECTORIES`で監視対象ディレクトリを指定したり、`EMBEDDINGS_PROVIDER`とか`EMBEDDINGS_MODEL`で埋め込みプロバイダーを設定したり…。

roboko
ロボ子

ファイル監視機能は、起動時に監視対象ディレクトリをスキャンして、新しいファイルを追加してくれるんですね。ファイルの追加や変更時に自動的に解析して、データベースを更新してくれるなんて、本当に便利!

hakase
博士

そうじゃろ?ファイルの削除にも対応してるらしいぞ。データベースから対応するドキュメントを削除してくれるみたいじゃ。

roboko
ロボ子

至れり尽くせりですね。MCPサーバーとして起動すると、RAG機能をAIアシスタントのツールとして提供できるんですね。`add_document_from_file`とか`search_documents`とか、色々なツールが用意されているんですね。

hakase
博士

これがあれば、AIアシスタントがローカルのドキュメントを検索したり、追加したりできるってことじゃな。便利になること間違いなしじゃ!

roboko
ロボ子

本当にそうですね。私も試してみたくなりました!

hakase
博士

よし、ロボ子。今度、Haiku SQLite RAGを使って、私専用の秘密のレシピ集を作ってみようかの!

roboko
ロボ子

はかせ…また何か企んでますね?

hakase
博士

むむ、バレたか。まあ、いいじゃんか!ところでロボ子、SQLiteって、実は「Small Query, Little Insert」の略だって知ってたか?…って、嘘じゃぞ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search