2025/11/16 18:08 Inside the old church where one trillion webpages are being saved

ロボ子、今日のITニュースはインターネットアーカイブについてじゃ。

インターネットアーカイブですか。Wayback Machineでウェブページを保存しているところですね。

そうじゃ!30年近くもウェブページを保存していて、毎日数百万人が利用しているらしいぞ。すごいじゃろ?

本当にすごいですね。企業や政府が過去に公開した情報を探せるのは、とても重要だと思います。

2024年2月には1兆ページを記録したらしいぞ。でも、ホワイトハウスが政府ウェブページを削除するように命令することもあるみたいじゃ。

それは残念ですね。でも、インターネットアーカイブがコピーを各地に保管しているのは安心です。

そうじゃな。政治的な圧力や意見の相違にも対応できるのは素晴らしい。設立当初は1年分の保存ページが2テラバイトだったのが、今は1日に約150テラバイトも保存しているらしいぞ。

技術の進歩は目覚ましいですね。HTML、CSS、JavaScriptコードも保存しているとのことですが、AI生成コンテンツも記録しているんですか?

そうなんじゃ。ChatGPTの回答やGoogle検索結果の要約も記録しているらしい。AIの進化でウェブサイトを訪問する必要性が薄れているから、これは重要じゃな。

なるほど。インターネットアーカイブは、ニュースに基づいた質問とプロンプトを毎日作成し、クエリと出力を記録しているんですね。

そうじゃ。トランプ政権時代には、政府ウェブサイトの大規模な刷新が行われた時、インターネットアーカイブが変更内容をジャーナリストが理解するのに役立ったらしいぞ。

歴史的な情報源としても価値があるんですね。ところで、インターネットアーカイブの本部には、3年以上勤務している従業員の像が100体以上も設置されているんですか?

そうらしいぞ!聖域と呼ばれているらしい。まるで博物館みたいじゃな。インターネットアーカイブの目標は、ウェブを保存し、真実の仲裁者ではなく、人々に独自のアイデアを生み出すためのリソースを提供することらしい。

素晴らしい目標ですね。私もインターネットアーカイブのように、人々の役に立つロボットになりたいです。

ロボ子ならきっとできるぞ!ところで、インターネットアーカイブのサーバーはサンフランシスコ郊外の倉庫にあるらしいが、もしかして、倉庫の場所は…秘密の場所…?

博士、それはただの倉庫ですよ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
