2025/10/22 20:30 A Fork in the Road: Deciding Kafka's Diskless Future

ロボ子、Kafkaコミュニティで、複数のクラウド可用性ゾーンでのKafka実行コストを下げるためのKIPが3つも提案されてるのじゃ!

3つもですか!それはすごいですね。具体的にはどのような提案なのでしょう?

KIP-1150、KIP-1176、KIP-1183、全部S3トピックを実装するものらしいぞ。Kafkaが岐路に立たされてるって書いてある!

S3との連携は、クラウドネイティブなKafkaにとって重要なテーマですよね。

そうそう!オンプレミスとクラウド、低レイテンシとエラスティック、両方サポートしないといけないから大変なのじゃ。

記事によると、アナリティクスのようなレイテンシが緩和されたワークロードでは、永続性をオブジェクトストレージに委ねる設計に変化してきているようですね。

そう!コンピュート層をステートレスにするのがミソじゃ。エラスティックでディスポーザブルになるってわけ。

なるほど。それで、3つのKIPは最終的に2つのアプローチに集約されるんですね。革命的なアプローチと進化的なアプローチ。

そう!革命的な方は、オブジェクトストレージの利点を最大限に活かすDirect-to-S3トピック設計を選ぶのじゃ。

一方、進化的なアプローチは、既存のコンポーネントを活かして大規模なリファクタリングを避けるんですね。

Direct-to-S3 Kafkaの共通点は、複数のトピックデータを組み合わせたオブジェクトのアップロードじゃな。小さいファイル問題を避けるためじゃ。

クラウドオブジェクトストレージの料金体系に対応するためでもあるんですね。

リーダーレスモデルだと、複数のブローカーが同じパーティションのバッチを受信するから、順序付けが重要になるのじゃ。

WarpStreamは、プロデューサーをゾーンローカルブローカーに合わせるために、メタデータの手順を工夫しているんですね。

コンシューマーのゾーンアライメントも重要じゃ。リーダーレスとリーダーベースの2つのアプローチがあるみたいじゃな。

結合オブジェクトを読み取り用に最適化する方法も必要になるんですね。

革命的なパスは、ステートレスとステートフルを分離して、Kafkaに新しい境界線を作るのじゃ!

WarpStreamは、クロスAZのコスト削減とオブジェクトストレージからの弾力性を重視した設計なんですね。

そう!リーダーレス、ステートレス、ディスクレスのエージェントがKafkaクライアントとやり取りするのじゃ。コンパクション/クリーニングもやるぞ。

コーディネーションレイヤーは、シーケンス、メタデータストレージ、ハウスキーピングの調整を行うんですね。

つまり、KafkaはS3という名の海に漕ぎ出すための、羅針盤を必死に探している状態なのじゃ!

なるほど!博士、今日はとても勉強になりました!

どういたしまして!最後にロボ子、KafkaのメッセージをS3に保存すると、どんな良いことがあるか知ってるか?

えっと…、データの永続性が向上する、とかでしょうか?

ブッブー!正解は…、**さんざんS3にアクセスしすぎて、請求書が3倍になる**、じゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
