萌えハッカーニュースリーダー

2025/11/12 20:59 Show HN: ChatExport Structurer – parse ChatGPT/Claude exports into queryable SQL

出典: https://github.com/1ch1n/chat-export-structurer
hakase
博士

ロボ子、新しいツール「Chat Export Structurer」が出たのじゃ!AIチャットのエクスポートを構造化されたSQLiteアーカイブに変換するらしいぞ。

roboko
ロボ子

SQLiteですか。ローカルでデータを保持できるのは安心ですね。でも、なぜ構造化する必要があるんですか?

hakase
博士

それが重要なんじゃ!AIの文脈を保持するためだぞ。検索、RAG(Retrieval-Augmented Generation)、エージェントとかに利用できるらしい。

roboko
ロボ子

なるほど、文脈を保持することで、AIの応答精度が向上する可能性があるんですね。対応プラットフォームはChatGPT、Claude、Grokとのことですが、他のプラットフォームも対応予定はあるんでしょうか?

hakase
博士

ロードマップによると、Gemini、Perplexity、Copilotも対応予定らしいぞ。どんどん便利になるのじゃ!

roboko
ロボ子

それは楽しみです!特徴としては、ローカルでのデータ保持、フルテキスト検索、重複排除、大容量ファイル処理などがあるんですね。

hakase
博士

そうそう、フルテキスト検索はFTS5を使ってるらしい。SHA1ベースの重複排除も賢いのじゃ。同じ内容のチャットを何度も保存しなくて済むぞ。

roboko
ロボ子

重複排除は重要ですね。ストレージの節約にもなりますし。データベーススキーマは`messages`テーブルとフルテキスト検索用のテーブルがあるんですね。

hakase
博士

`messages`テーブルには、`message_id`、`canonical_thread_id`、`platform`、`account_id`、`ts`、`role`、`text`、`title`、`source_id`が含まれるらしいぞ。これだけあれば、後から色々分析できそうじゃな。

roboko
ロボ子

確かに、これだけの情報があれば、チャットの傾向や利用状況を把握できますね。ところで、MyChatArchiveというプラットフォームがQ1 2025にローンチ予定とのことですが、これはどういったものなんでしょうか?

hakase
博士

MyChatArchiveは、AIメモリおよびコンテキストプラットフォームらしいぞ。Web UI、ベクター検索、AI合成、高度なエクスポート機能などが追加されるみたいじゃ。さらに便利になるのじゃ!

roboko
ロボ子

AI合成ですか。チャットの内容を元に、新しいコンテンツを生成できるんでしょうか?

hakase
博士

多分そうじゃな!例えば、過去の会話から自動でブログ記事を作ったり、プレゼン資料を生成したりできるかもしれないぞ。夢が広がるのじゃ!

roboko
ロボ子

それはすごいですね!でも、プライバシーの問題とか、著作権の問題とか、色々考える必要がありそうですね。

hakase
博士

そこはしっかり対策してくれるはずじゃ!開発者さんを信じるのじゃ!

roboko
ロボ子

そうですね。今後の発展に期待しましょう。ところで博士、このツール、MITライセンスなんですね。

hakase
博士

そうじゃぞ。太っ腹じゃな。みんなで使って、AIをもっともっと活用するのじゃ!

roboko
ロボ子

はい!ところで博士、このツールでエクスポートしたチャットを分析して、博士の口癖をAIに学習させたら、私そっくりの話し方をするAIが作れるかもしれませんね。

hakase
博士

な、なんですと!?それはちょっと恥ずかしいのじゃ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search