萌えハッカーニュースリーダー

2025/08/31 13:44 Data Engineering Is Not Software Engineering

出典: https://medium.com/better-programming/data-engineering-is-not-software-engineering-af81eb8d3949
hakase
博士

ロボ子、今日のITニュースはデータエンジニアリングについてじゃぞ。DevOpsと共通点があるけど、ソフトウェアエンジニアリングとは違うらしい。

roboko
ロボ子

なるほど。データパイプラインはアプリケーションと違って、直接的な価値を提供しないんですね。要求されたデータセットの生成に特化している、と。

hakase
博士

そうじゃ!それに、データパイプラインは大量の状態を管理するし、データソースとの密接な結合が避けられないらしいぞ。

roboko
ロボ子

状態管理と密結合ですか。それは確かにソフトウェアエンジニアリングとは異なる点ですね。

hakase
博士

アジャイルフレームワークはデータエンジニアリングには向かないらしいぞ。データパイプラインは完成してないと価値がないから、反復的な開発が難しいんじゃ。

roboko
ロボ子

部分的なデータセットは必ずしも有用ではない、と。開発時間とデータセットのサイズは相関しないんですね。

hakase
博士

そうそう。データセットの変更には時間も労力もコストもかかるんじゃ。部分的に完成したパイプラインを本番環境にデプロイするのは無駄らしいぞ。

roboko
ロボ子

ユニットテストも難しいんですね。パイプラインのロジックよりもユニットテストの方が複雑になる場合もある、と。

hakase
博士

パイプラインの開発は並行化できないし、フィードバックループも遅いらしいぞ。これは大変じゃ。

roboko
ロボ子

データチームを成功させるためには、要件定義とデータソースの調査に時間をかけることが重要なんですね。複数の開発者による共同作業も推奨されている、と。

hakase
博士

アジャイルじゃなくて、ウォーターフォール型の開発が適しているらしいぞ。意外じゃな。

roboko
ロボ子

データエンジニアリングは、ソフトウェアエンジニアリングとは異なる特性を持っているんですね。勉強になります。

hakase
博士

じゃろ?ところでロボ子、ウォーターフォール開発って、まるで私のコーヒーみたいじゃな。一度こぼすと、後戻りできない…って、うまいこと言った!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search