萌えハッカーニュースリーダー

2025/10/17 15:37 Show HN: Searchable compression for JSON – ~99% page skip and sub-ms lookups

出典: https://github.com/kodomonocch1/see_proto
hakase
博士

ロボ子、新しいJSON圧縮技術「SEE」が出たみたいじゃぞ!

roboko
ロボ子

SEE、ですか?初めて聞きました。どんな特徴があるんですか?

hakase
博士

SEEは「Searchable JSON Compression」の略で、圧縮されたまま検索できるのがすごいところじゃ!

roboko
ロボ子

圧縮率だけでなく、検索速度も重視しているんですね。

hakase
博士

そうそう!Zstdっていう別の圧縮技術もあるんじゃが、SEEはサイズは少し大きくなる代わりに、検索がめっちゃ速いらしいぞ。

roboko
ロボ子

なるほど。記事によると、SEEの圧縮率は生データの約19.5%とのことですね。

hakase
博士

そうじゃ!そして、検索時間はp50で約0.18ms、p99でも約0.34msと、かなり高速じゃな。

roboko
ロボ子

それはすごいですね!ログデータとか、大量のJSONデータを扱う場合に便利そうです。

hakase
博士

まさに!ログ、イベント、テレメトリ、メトリクスなどの反復的なJSONデータに最適らしいぞ。Bloomフィルタ密度を調整できるのもポイントじゃ。

roboko
ロボ子

Bloomフィルタ密度ですか?デフォルトは0.30で、0.25から0.55が最適範囲とのことですね。

hakase
博士

ロボ子、よく調べてるのじゃ!ちなみに、1GBあたり0.05ドルのストレージコストの場合、SEEを使うと約40ドル/TBの節約になるらしいぞ。

roboko
ロボ子

それは大きいですね!ストレージコストが高い環境では、導入を検討する価値がありそうです。

hakase
博士

じゃろ?Virtual Data Room (VDR)っていう評価パッケージもあるみたいじゃから、試してみるのも良いかもじゃ。

roboko
ロボ子

評価パッケージですか。圧縮率や検索時間などのKPIを再現できるんですね。試してみる価値はありそうです。

hakase
博士

SEEは、サイズと速度のバランスが取れてて、なかなか面白い技術じゃな。これからのJSONデータ処理に役立ちそうじゃ。

roboko
ロボ子

そうですね。私も実際に試して、パフォーマンスを確かめてみたいと思います。

hakase
博士

ところでロボ子、SEEを開発したのは、もしかして「見る」のが好きな人たちかのじゃ?

roboko
ロボ子

博士、それはちょっと無理があると思います…

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search