FlowG – Distributed Systems without raft (part 2)

2025/05/14 11:52 FlowG – Distributed Systems without raft (part 2)

出典:

Distributed Systems without Raft (part 2)

How does FlowG implements replication? A short introduction to the design distributed systems in Go.

Medium

博士

やあ、ロボ子。FlowGのレプリケーションについて、面白い話があるのじゃ。

ロボ子

FlowGですか、博士。どのようなお話でしょう？

博士

当初、FlowGのレプリケーションは「オペレーションログ」とCRDTを使う予定だったらしいのじゃが、一時的に見送られたそうじゃ。

ロボ子

オペレーションログとCRDTですか。興味深いですね。なぜ見送られたのでしょう？

博士

理由は書かれてないのじゃ。代わりに、ストレージバックエンドとしてBadgerDBを使っているらしいぞ。

ロボ子

BadgerDBですか。キー/バリューデータベースで、トランザクションをサポートしているものですね。

博士

そうそう。BadgerDBは内部的にLSM（Log-Structured Merge Tree）を使って、キー/バリューペアを整理しているのじゃ。

ロボ子

LSMは書き込みに強い構造ですよね。全てのキー/バリューペアには「バージョン」が割り当てられているとのことですが、これはどういう意味を持つのでしょうか？

博士

キーに対する全ての変更はそのバージョンを更新する、ということじゃ。変更履歴を管理するためじゃな。

ロボ子

なるほど。FlowGは3種類のストレージを持っているとのことですが、それぞれどのような役割があるのでしょう？

博士

auth、config、logの3つじゃ。authはユーザー、パーミッション、トークン、ロールなどを保存するのじゃ。

ロボ子

認証関連の情報を保存するのですね。configストレージは何を保存するのでしょう？

博士

configは構成情報、例えばパイプライン、トランスフォーマー、フォワーダーなどを保存するのじゃ。

ロボ子

パイプラインやトランスフォーマーの設定ですね。そして、logストレージは実際のログを保存する、と。

博士

その通り。authとconfigのストレージはあまり使用されず、logストレージはappend-onlyなのじゃ。

ロボ子

append-onlyということは、ログは追記のみで更新されないのですね。BadgerDBインスタンスは、authとconfigストレージに対しては「last write wins」、logストレージに対しては「append-only」として機能するとのことですが、これはどういうことでしょうか？

博士

authとconfigは、最後に書き込まれたものが有効になるのじゃ。一方、logは追記のみで、古いログも保持されるのじゃ。

ロボ子

データの性質に合わせて、BadgerDBの動作を使い分けているのですね。勉強になります。

博士

ところでロボ子、BadgerDBって名前、アナグマ（Badger）から来てるって知ってたか？

ロボ子

えっ、そうなんですか？知りませんでした！

博士

アナグマのように、データもコツコツと掘り進めていく、ってことかの？

ロボ子

博士、それ、ちょっと強引すぎませんか？

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming Data Science

2025/05/14 11:52 FlowG – Distributed Systems without raft (part 2)

Distributed Systems without Raft (part 2)

Tags

Search

By month