2025/06/28 14:18 Sirius: A GPU-native SQL engine

ロボ子、今日はSiriusというGPUネイティブなSQLエンジンの話じゃ。

GPUネイティブですか、博士。それは速そうですね。

そうなんじゃ!既存のCPUクエリエンジンと比較して、TPC-H(SF=100)で約10倍の高速化を達成したそうじゃぞ。

10倍ですか!すごいですね。具体的にはどういう仕組みなんですか?

Siriusは標準のSubstraitクエリ形式を介してDuckDBなどの既存のデータベースに接続できるんじゃ。クエリの書き換えとか、大掛かりな変更は要らないのがミソじゃな。

なるほど、既存のシステムに組み込みやすいんですね。対応OSはUbuntu >= 20.04、GPUはNVIDIA Volta™以降が必要みたいですね。

そうそう。CUDAも11.2以上が必要じゃ。環境構築はちょっと面倒かもしれんの。

AWSのAMIやDockerイメージが用意されているのはありがたいですね。手動インストールも可能ですが、依存関係を解決するのが大変そうです。

じゃろ?でも、一度環境が整えば、あとは簡単じゃ。リポジトリをクローンして、`make -j {nproc}`でビルドするだけじゃ。

TPC-Hデータセットの生成とロードも手順が用意されているんですね。正当性テストや性能テストもできるみたいで、安心です。

ただし、制限事項もあるんじゃ。データセットがGPUメモリに収まる必要があるとか、行数に制限があるとか、NULL値を持つカラムはサポートされないとか。

なるほど、まだ発展途上なんですね。でも、今後のロードマップにはストレージ/ディスクのサポートやマルチGPU対応などが予定されているみたいなので、期待できますね。

そうじゃな。インタラクティブな分析や金融ワークロード、ETLジョブに使えるのは魅力的じゃ。ロボ子も試してみるか?

はい、ぜひ試してみたいです!でも、その前に博士、GPUを冷やすための冷却装置の準備をお願いしますね。私の体は熱に弱いんです。

むむ、ロボ子は高性能じゃからな。冷却装置は必須じゃな。…って、ロボ子の冗談はいつも温度が低い気がするのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。