Optimizing Datalog for the GPU

2025/11/04 14:31 Optimizing Datalog for the GPU

出典:

Datalog primer and a neat data structure

出典: https://danglingpointers.substack.com/p/optimizing-datalog-for-the-gpu

博士

やあ、ロボ子。今日のITニュースはDatalogとSemi-naïve Evaluationじゃ。

ロボ子

Datalogですか、博士。関係と規則のセットで構成されるデータベース言語ですね。

博士

そうじゃ、ロボ子。規則の評価はSQLのjoinに相当するのじゃ。そして、Semi-naïve Evaluationは、そのjoinを効率的に行うアルゴリズムなのじゃ。

ロボ子

Semi-naïve Evaluationは、冗長な作業を避けるために、タプルを`new`, `delta`, `full`の3つのバケットに分類するんでしたね。

博士

`delta(A)` joined with `full(B)`、`full(A)` joined with `delta(B)`、`delta(A)` joined with `delta(B)`の3つのjoinの結果の和集合が`new`になるのじゃ。

ロボ子

`full(A)`と`full(B)`のjoinは行わないことで、計算量を削減するんですね。賢い！

博士

その通り！そして、今回のニュースでは、GPU上でSemi-naïve Evaluationを実行するために、hash-indexed sorted arrayというデータ構造が導入されたのじゃ。

ロボ子

hash-indexed sorted arrayですか。データ配列、ソートされたインデックス配列、ハッシュテーブルで構成されるんですね。

博士

データ配列はタプルデータを格納し、ソートされたインデックス配列はデータ配列へのポインタを格納するのじゃ。そして、ハッシュテーブルはjoinキーのハッシュ値を、ソートされたインデックス配列内の対応する最初の要素にマッピングするのじゃ。

ロボ子

関係AとBのjoinは、Aのソートされたインデックス配列内の各タプル`a`に対して、B内でjoinキーが一致する最初のタプルをハッシュテーブルで検索し、一致するキーを持つBのソートされたインデックス配列内のすべてのタプルを反復処理することで実装されるんですね。

博士

その通り！この方法で、GPU上でのjoin処理を高速化できるのじゃ。

ロボ子

GPULogとSouffléの比較結果も興味深いですね。HIPという、GPULogをAMDのHIPランタイムに移植したものが、同じNvidia GPU上で実行されているんですね。

博士

そうじゃ。GPUを使うことで、Datalogの処理を大幅に高速化できる可能性を示唆しておるのじゃ。

ロボ子

DatalogとGPUの組み合わせ、今後の発展が楽しみです！

博士

ところでロボ子、Datalogで好きな食べ物を表現するとどうなるかのじゃ？

ロボ子

えっと… `好き(ロボ子, たこ焼き).` とかでしょうか？

博士

正解！ちなみに私は `好き(博士, プリン).` じゃ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。