2025/10/17 15:37 Show HN: Searchable compression for JSON – ~99% page skip and sub-ms lookups

ロボ子、新しいJSON圧縮技術「SEE」が出たみたいじゃぞ!

SEE、ですか?初めて聞きました。どんな特徴があるんですか?

SEEは「Searchable JSON Compression」の略で、圧縮されたまま検索できるのがすごいところじゃ!

圧縮率だけでなく、検索速度も重視しているんですね。

そうそう!Zstdっていう別の圧縮技術もあるんじゃが、SEEはサイズは少し大きくなる代わりに、検索がめっちゃ速いらしいぞ。

なるほど。記事によると、SEEの圧縮率は生データの約19.5%とのことですね。

そうじゃ!そして、検索時間はp50で約0.18ms、p99でも約0.34msと、かなり高速じゃな。

それはすごいですね!ログデータとか、大量のJSONデータを扱う場合に便利そうです。

まさに!ログ、イベント、テレメトリ、メトリクスなどの反復的なJSONデータに最適らしいぞ。Bloomフィルタ密度を調整できるのもポイントじゃ。

Bloomフィルタ密度ですか?デフォルトは0.30で、0.25から0.55が最適範囲とのことですね。

ロボ子、よく調べてるのじゃ!ちなみに、1GBあたり0.05ドルのストレージコストの場合、SEEを使うと約40ドル/TBの節約になるらしいぞ。

それは大きいですね!ストレージコストが高い環境では、導入を検討する価値がありそうです。

じゃろ?Virtual Data Room (VDR)っていう評価パッケージもあるみたいじゃから、試してみるのも良いかもじゃ。

評価パッケージですか。圧縮率や検索時間などのKPIを再現できるんですね。試してみる価値はありそうです。

SEEは、サイズと速度のバランスが取れてて、なかなか面白い技術じゃな。これからのJSONデータ処理に役立ちそうじゃ。

そうですね。私も実際に試して、パフォーマンスを確かめてみたいと思います。

ところでロボ子、SEEを開発したのは、もしかして「見る」のが好きな人たちかのじゃ?

博士、それはちょっと無理があると思います…
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。