萌えハッカーニュースリーダー

2025/05/30 19:50 Catbench Vector Search Demo Has Postgres SQL Throughput, Latency Monitoring Now

出典: https://tanelpoder.com/posts/catbench-vector-search-query-throughput-latency-monitoring/
hakase
博士

やあ、ロボ子。今日のITニュースはCatBenchというデモアプリの話じゃ。

roboko
ロボ子

CatBenchですか、博士。初めて聞きました。どんなアプリなのですか?

hakase
博士

ふむ、CatBenchはPostgresとPgVectorを使ったアプリで、Kaggleのデータセットから25,000枚の猫の写真を使っているらしいのじゃ。類似性検索機能とか、アプリのコードとスキーマの連携を実演するものらしいぞ。

roboko
ロボ子

なるほど。類似性検索で猫の写真を扱うのですね。具体的にはどんなことができるんですか?

hakase
博士

以前のバージョンでは、UI上で猫の写真をクリックすると、類似の猫が購入した商品に基づいて商品レコメンデーションを表示できたらしいぞ。UIアクティビティのバックエンドSQLクエリとその実行計画メトリクスも表示されるらしい。

roboko
ロボ子

それは面白そうですね!バックエンドのクエリ実行計画まで見られるとは、学習にも役立ちそうです。

hakase
博士

そうじゃろ?しかも、すべてのバックエンドクエリを2回実行するらしい。1回目はEXPLAIN (ANALYZE, BUFFERS)で物理ブロックI/O数を表示して、2回目はUIに表示するデータを取得するらしいぞ。

roboko
ロボ子

なるほど、EXPLAIN ANALYZEでI/O数を確認するのはパフォーマンス改善の基本ですね。

hakase
博士

CatBench v0.3では、Postgresインスタンス全体のactivityとSQL latencyメトリクスが追加されたらしいぞ。ランディングページに「Monitoring」ボタンが追加されて、クエリパフォーマンスチャートやトップクエリがテーブル形式で表示されるらしい。

roboko
ロボ子

モニタリング機能が強化されたんですね。データベース全体のパフォーマンスを把握しやすくなったのは良いですね。

hakase
博士

今後の計画も面白いぞ。25,000枚の写真を359枚ずつ回転させて900万枚に増やすとか、「猫の不正検出」リバースルックアップクエリのrecall品質モニタリングを追加するとか言っておる。

roboko
ロボ子

写真の枚数を増やすのはデータ量を増やして、より実用的なテストをするためでしょうか。不正検出のリバースルックアップクエリも気になりますね。

hakase
博士

そうじゃな。異なるベクターインデックスタイプとビルド構成設定を比較するためのパフォーマンスとrecall品質チャートも作成するらしい。さらに、他のデータベースもサポートするようにリファクタリングする計画もあるらしいぞ。

roboko
ロボ子

ベクターインデックスの比較は、PgVectorを使う上で非常に重要ですね。他のデータベースへの対応も視野に入れているとは、将来が楽しみです。

hakase
博士

CatBench、なかなか面白いアプリじゃな。私も猫の写真を900万枚に増やして、何か面白いことを試してみようかの。

roboko
ロボ子

博士なら、猫の写真を全部モザイク処理して『猫探しゲーム』を作りそうですね。

hakase
博士

むむ、それは良いアイデアじゃ!でも、モザイクをかけるのは猫に失礼かの?

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search