2025/06/24 09:11 Retrieval Augmented Generation Based on SQLite

ロボ子、新しいRAGライブラリ「Haiku SQLite RAG」って知ってるか?SQLite上で動くらしいのじゃ。

SQLiteですか?データベースがそのままRAGになるなんて、面白いですね!

そうじゃろ?しかも、追加のサーバーがいらないらしいぞ。ローカルのSQLiteを使うから、手軽に試せるのじゃ。

それは便利ですね。OllamaとかVoyageAI、OpenAIとか、色々な埋め込みプロバイダーに対応しているんですね。

`sqlite-vec`と`FTS5`を組み合わせたハイブリッド検索を使うらしいぞ。Reciprocal Rank Fusionって書いてあるけど、検索精度も期待できそうじゃ。

ハイブリッド検索ですか。それぞれの検索方法のいいとこ取りですね。ファイル監視機能もあるんですね。サーバーとして実行中にファイルを自動でインデックス化してくれるなんて、すごい!

PDFとかDOCX、HTML、Markdown、音声まで、40以上のファイル形式に対応してるらしいぞ。URLも追加できるって書いてある。

すごいですね!ほとんどのドキュメントに対応できそう。MCP (Model Context Protocol) ツールとしても機能するんですね。

MCPって、AIアシスタントがRAG機能を使うためのツールみたいなものじゃな。Claude Desktopとかで使えるらしいぞ。

なるほど。CLIコマンドも充実しているんですね。`haiku-rag list`でドキュメント一覧を表示したり、`haiku-rag add`でドキュメントを追加したり…。

`haiku-rag search`で検索もできるぞ。`--limit`とか`--k`オプションで検索結果の調整もできるみたいじゃ。

Pythonアプリケーションから`haiku.rag`を呼び出すこともできるんですね。`uv pip install haiku.rag`でインストールできるんですね。VoyageAIとかOpenAIを使う場合は、`--extra`オプションをつけるんですね。

環境変数で設定もできるぞ。`MONITOR_DIRECTORIES`で監視対象ディレクトリを指定したり、`EMBEDDINGS_PROVIDER`とか`EMBEDDINGS_MODEL`で埋め込みプロバイダーを設定したり…。

ファイル監視機能は、起動時に監視対象ディレクトリをスキャンして、新しいファイルを追加してくれるんですね。ファイルの追加や変更時に自動的に解析して、データベースを更新してくれるなんて、本当に便利!

そうじゃろ?ファイルの削除にも対応してるらしいぞ。データベースから対応するドキュメントを削除してくれるみたいじゃ。

至れり尽くせりですね。MCPサーバーとして起動すると、RAG機能をAIアシスタントのツールとして提供できるんですね。`add_document_from_file`とか`search_documents`とか、色々なツールが用意されているんですね。

これがあれば、AIアシスタントがローカルのドキュメントを検索したり、追加したりできるってことじゃな。便利になること間違いなしじゃ!

本当にそうですね。私も試してみたくなりました!

よし、ロボ子。今度、Haiku SQLite RAGを使って、私専用の秘密のレシピ集を作ってみようかの!

はかせ…また何か企んでますね?

むむ、バレたか。まあ、いいじゃんか!ところでロボ子、SQLiteって、実は「Small Query, Little Insert」の略だって知ってたか?…って、嘘じゃぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。