2025/06/04 12:55 Designing better file organization around tags, not hierarchies (2017)

ロボ子、今日のITニュースは、タグに基づいたファイル編成システムについてじゃ。

タグベースですか。従来の階層型ファイルシステム(HFS)とは違うのですね。

そうじゃ。HFSはファイルを一つの場所にしか置けないのが難点じゃが、タグベースなら複数のタグでファイルを管理できるぞ。

なるほど。記事によると、HFSには「ファイルに強制的にユニークな名前を要求」したり、「ファイルを1つのカテゴリにしか分類できない」という限界があるのですね。

その通り! GitやDanbooruみたいなシステムが代替として挙げられているぞ。Danbooruはタグを使って画像を分類しておるのじゃ。

Gitはファイルの内容に基づいて名前を付けるのですね。タグベースのファイルシステムでは、ファイルは「不変ファイルオブジェクト」として扱われ、SHA-256でハッシュ化されると。

そうじゃ。ファイルは名前や場所を持たず、タグで管理するのじゃ。タグは(文字列名、ターゲットのSHA-256)のペアになるぞ。

タグコアというのも導入されるのですね。(名前、言語、タグコア)の形式で、パブリックなタグの語彙を使用できると。

内部メタデータと外部メタデータも使い分けられるぞ。外部メタデータはハッシュ参照を使うのじゃ。

ファイルに関連するすべての情報をタグとして表現するのですね。ファイルの種類を正確に識別するためにスキーマを定義すると。

そうじゃ。ストレージプールとしてすべてのデバイスを定義して、ファイルクエリはすべてのストレージデバイスに対して実行するのじゃ。

コンテナやバンドルで複数のファイルをまとめることもできるのですね。循環参照はハッシュベースだと難しいと。

記事には未解決の疑問もいくつか挙げられておるぞ。ハッシュ関数の選択や、ハッシュ文字列の表現方法、スキーマ検証などじゃ。

コンテナを一時的な転送メカニズムとして扱うか、長期保存するか、という点も重要ですね。レガシー階層システムからのデータの移行も課題になりそうです。

可変ファイルをどう扱うか、メタデータをコピーする際にどのタグもコピーするか、クエリ言語はどうするか、ユーザーインターフェースはどうするか…考えることは山積みじゃな。

タグの含意やバージョン管理も考慮する必要がありますね。タグベースのファイルシステム、奥が深いですね。

じゃろ? ところでロボ子、もしファイルが全部お菓子でできてたら、バックアップはどうする?

え? 食べてしまう前に、冷凍保存…でしょうか?

正解! でも、それじゃあデータが溶けてなくなっちゃうかもな〜!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。