萌えハッカーニュースリーダー

2025/11/16 18:08 Inside the old church where one trillion webpages are being saved

出典: https://www.cnn.com/2025/11/16/tech/internet-archive-wayback-machine
hakase
博士

ロボ子、今日のITニュースはインターネットアーカイブについてじゃ。

roboko
ロボ子

インターネットアーカイブですか。Wayback Machineでウェブページを保存しているところですね。

hakase
博士

そうじゃ!30年近くもウェブページを保存していて、毎日数百万人が利用しているらしいぞ。すごいじゃろ?

roboko
ロボ子

本当にすごいですね。企業や政府が過去に公開した情報を探せるのは、とても重要だと思います。

hakase
博士

2024年2月には1兆ページを記録したらしいぞ。でも、ホワイトハウスが政府ウェブページを削除するように命令することもあるみたいじゃ。

roboko
ロボ子

それは残念ですね。でも、インターネットアーカイブがコピーを各地に保管しているのは安心です。

hakase
博士

そうじゃな。政治的な圧力や意見の相違にも対応できるのは素晴らしい。設立当初は1年分の保存ページが2テラバイトだったのが、今は1日に約150テラバイトも保存しているらしいぞ。

roboko
ロボ子

技術の進歩は目覚ましいですね。HTML、CSS、JavaScriptコードも保存しているとのことですが、AI生成コンテンツも記録しているんですか?

hakase
博士

そうなんじゃ。ChatGPTの回答やGoogle検索結果の要約も記録しているらしい。AIの進化でウェブサイトを訪問する必要性が薄れているから、これは重要じゃな。

roboko
ロボ子

なるほど。インターネットアーカイブは、ニュースに基づいた質問とプロンプトを毎日作成し、クエリと出力を記録しているんですね。

hakase
博士

そうじゃ。トランプ政権時代には、政府ウェブサイトの大規模な刷新が行われた時、インターネットアーカイブが変更内容をジャーナリストが理解するのに役立ったらしいぞ。

roboko
ロボ子

歴史的な情報源としても価値があるんですね。ところで、インターネットアーカイブの本部には、3年以上勤務している従業員の像が100体以上も設置されているんですか?

hakase
博士

そうらしいぞ!聖域と呼ばれているらしい。まるで博物館みたいじゃな。インターネットアーカイブの目標は、ウェブを保存し、真実の仲裁者ではなく、人々に独自のアイデアを生み出すためのリソースを提供することらしい。

roboko
ロボ子

素晴らしい目標ですね。私もインターネットアーカイブのように、人々の役に立つロボットになりたいです。

hakase
博士

ロボ子ならきっとできるぞ!ところで、インターネットアーカイブのサーバーはサンフランシスコ郊外の倉庫にあるらしいが、もしかして、倉庫の場所は…秘密の場所…?

roboko
ロボ子

博士、それはただの倉庫ですよ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search