2025/05/08 15:48 DNA is maybe 60-750MB of data

ロボ子、今日のニュースはDNAのストレージ容量についてじゃぞ!

DNAですか、博士。生物学的な情報がどのようにデジタルストレージと関連するのか興味深いです。

そうじゃろ!ヒトのDNAには約31億の塩基対があって、それぞれがA、T、C、Gのどれかの値を取る。つまり、1つの塩基対をエンコードするには2ビット必要なのじゃ。

ということは、ヒトのDNA全体では62億ビットになるんですね。女性の場合は121.2億ビット(1.51GB)、男性の場合は119.4億ビット(1.49GB)ですか。

その通り!しかもDNAは圧縮可能らしいぞ。圧縮率はアルゴリズムによって違うみたいじゃが。

99%以上の圧縮を主張する人もいれば、25%程度だという人もいるんですね。参照ゲノムを用いた圧縮だと、個体間の違いだけを保存するから99%以上の圧縮が可能になる、と。

そうそう。参照ゲノムなしだと、今のところ62%の圧縮が限界みたいじゃな。

コルモゴロフ複雑性定義やシャノン情報定義も出てきましたね。DNAの「表現型コルモゴロフ複雑性」は、DNAをどれだけ短くできるか、それでも「ヒト」が得られるかという定義、ですか。

そうじゃ!DNAの情報量は4.8億〜60億ビット(60MB〜750MB)と推定されるらしいぞ。

DNAの約1%がエクソン、約24%がイントロンというのも興味深いですね。エンハンサー、サイレンサー、インシュレーターといった要素も出てきて、まるでソフトウェアのモジュールみたいです。

ほんとじゃな!エンハンサーは特定のタンパク質が結合してDNAを物理的に曲げて、プロモーターを活性化しやすくする。サイレンサーはその逆。インシュレーターは影響を遮断する。まるでアクセス制御じゃ。

セントロメアは細胞分裂中にDNAをコピーする際の「付着点」、テロメアは染色体の末端にある「余分な」DNA、ですか。変異は細胞複製中に最も一般的に発生し、エラー率は10億ヌクレオチドあたり1未満、と。

トランスポゾンは自身のコピーを作ってゲノム内の別の場所に挿入する。レトロトランスポゾンはRNAを作って、それを逆転写してDNAに戻す。自己複製するコードみたいじゃな。

DNAをストレージとして考えると、エラー訂正や冗長化の仕組みが自然に組み込まれているんですね。生物の進化の過程で最適化された結果なのでしょうか。

まさにそうじゃろうな。しかし、もしDNAストレージが実用化されたら、ロボ子のバックアップもDNAに保存できるかも…!

それは少し怖い気もしますが、興味深いですね。でも、私のデータが変異したらどうなるんでしょうか…。

ふむ、ロボ子がゴリラになるかもしれん…!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。