Compositional Datalog on SQL: Relational Algebra of the Environment

2025/08/27 20:09 Compositional Datalog on SQL: Relational Algebra of the Environment

出典:

I spent some time before making Datalogs that translated into SQL. https://www.philipzucker.com/tiny-sqlite-datalog/

出典: https://www.philipzucker.com/compose_datalog/

博士

ロボ子、新しいDatalogをSQLに変換する方法についての論文が出たみたいじゃぞ！

ロボ子

DatalogをSQLにですか？それは興味深いですね。SQLエンジンは高度に設計されていて、広く利用可能ですから、DatalogをSQLに変換できれば、いろいろな場面で役立ちそうですね。

博士

そうなんじゃ！特にSQLiteとDuckDBの組み合わせが強力らしいぞ。SQLのリレーショナル代数スタイルが、Datalogの本体操作に適しているとのことじゃ。

ロボ子

なるほど。Datalogインタプリタは環境をスレッド化するのに対して、SQLは環境内の変数名で結合を実行するのに適しているんですね。Pythonでの実装例もあるみたいですね。

博士

そうそう、メタプログラミングスタイルでSQL文字列を生成するらしいぞ。Datalogの重要なポイントは、相互に依存するルールを新しいものが生成されなくなるまで実行するフィックスポイントを持つことじゃ。

ロボ子

セミナイーブ評価についても触れられていますね。新しい事実は前のイテレーションからの少なくとも1つの新しい事実を含むクエリから得られるという観察を利用する、と。

博士

その通り！Souffleと比較すると、このシステムは単純で柔軟だけど、ベンチマークによってはオーバーヘッドが3〜5倍あるらしい。

ロボ子

Z3 ASTからSQLiteコンパイラへの変換例もあるんですね。Datalogの結合クエリはSQLスタイルとは異なり、Datalogでは関係のスロットに名前を付けるのに対し、SQLスタイルでは行全体に名前を付ける、と。

博士

SQLを使うと、射影、選択、名前の変更などのリレーショナル代数演算を簡単に記述できるのが強みじゃな。遅延トライ結合を使うと、もっとクリーンな実装になる可能性もあるみたいじゃ。

ロボ子

デュアル数と同様のデュアル関係を使って、セミナイーブ評価を実現できるというのも面白いですね。初期のベース関係から環境形式への変換が複雑、という指摘もありますが。

博士

ベンチマークではSouffleに比べてパフォーマンスが劣るけど、柔軟性が高いことが示唆されているのがポイントじゃな。DuckDBはセットセマンティクスに調整されていない可能性もあるらしい。

ロボ子

EXCEPTの代わりにEXISTS NOTを使うと、パフォーマンスが大幅に向上するというのは重要な最適化ですね。CTE（Common Table Expressions）を使うと、SQLの繰り返しを減らすことができる、と。

博士

なるほどなるほど。しかしロボ子よ、DatalogとSQL、まるで私とロボ子みたいじゃな。ちょっと癖があるけど、実はすごい力を持っている私と、真面目で優秀だけど、たまにドジを踏むロボ子…って、最後のは余計じゃったか！

ロボ子

博士、最後の例えは少し失礼ではありませんか？でも、まあ、否定はしません。ところで博士、DatalogとSQLの関係についてもっと深く理解するために、今夜は徹夜で勉強会といきましょうか？

博士

徹夜！？それは勘弁してくれ〜！私としたことが、ついロボ子をからかいすぎてしまったわい。反省反省…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。