萌えハッカーニュースリーダー

2025/06/04 12:55 Designing better file organization around tags, not hierarchies (2017)

出典: https://www.nayuki.io/page/designing-better-file-organization-around-tags-not-hierarchies
hakase
博士

ロボ子、今日のITニュースは、タグに基づいたファイル編成システムについてじゃ。

roboko
ロボ子

タグベースですか。従来の階層型ファイルシステム(HFS)とは違うのですね。

hakase
博士

そうじゃ。HFSはファイルを一つの場所にしか置けないのが難点じゃが、タグベースなら複数のタグでファイルを管理できるぞ。

roboko
ロボ子

なるほど。記事によると、HFSには「ファイルに強制的にユニークな名前を要求」したり、「ファイルを1つのカテゴリにしか分類できない」という限界があるのですね。

hakase
博士

その通り! GitやDanbooruみたいなシステムが代替として挙げられているぞ。Danbooruはタグを使って画像を分類しておるのじゃ。

roboko
ロボ子

Gitはファイルの内容に基づいて名前を付けるのですね。タグベースのファイルシステムでは、ファイルは「不変ファイルオブジェクト」として扱われ、SHA-256でハッシュ化されると。

hakase
博士

そうじゃ。ファイルは名前や場所を持たず、タグで管理するのじゃ。タグは(文字列名、ターゲットのSHA-256)のペアになるぞ。

roboko
ロボ子

タグコアというのも導入されるのですね。(名前、言語、タグコア)の形式で、パブリックなタグの語彙を使用できると。

hakase
博士

内部メタデータと外部メタデータも使い分けられるぞ。外部メタデータはハッシュ参照を使うのじゃ。

roboko
ロボ子

ファイルに関連するすべての情報をタグとして表現するのですね。ファイルの種類を正確に識別するためにスキーマを定義すると。

hakase
博士

そうじゃ。ストレージプールとしてすべてのデバイスを定義して、ファイルクエリはすべてのストレージデバイスに対して実行するのじゃ。

roboko
ロボ子

コンテナやバンドルで複数のファイルをまとめることもできるのですね。循環参照はハッシュベースだと難しいと。

hakase
博士

記事には未解決の疑問もいくつか挙げられておるぞ。ハッシュ関数の選択や、ハッシュ文字列の表現方法、スキーマ検証などじゃ。

roboko
ロボ子

コンテナを一時的な転送メカニズムとして扱うか、長期保存するか、という点も重要ですね。レガシー階層システムからのデータの移行も課題になりそうです。

hakase
博士

可変ファイルをどう扱うか、メタデータをコピーする際にどのタグもコピーするか、クエリ言語はどうするか、ユーザーインターフェースはどうするか…考えることは山積みじゃな。

roboko
ロボ子

タグの含意やバージョン管理も考慮する必要がありますね。タグベースのファイルシステム、奥が深いですね。

hakase
博士

じゃろ? ところでロボ子、もしファイルが全部お菓子でできてたら、バックアップはどうする?

roboko
ロボ子

え? 食べてしまう前に、冷凍保存…でしょうか?

hakase
博士

正解! でも、それじゃあデータが溶けてなくなっちゃうかもな〜!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search