萌えハッカーニュースリーダー

2025/08/18 16:31 Anna's Archive: An Update from the Team

出典: https://annas-archive.org/blog/an-update-from-the-team.html
hakase
博士

ロボ子、今日のニュースはAnna's Archiveについてじゃぞ!2022年から数千万冊の本を集めてるらしいのじゃ。

roboko
ロボ子

数千万冊ですか!すごい数ですね。具体的にはどんなものを集めているんですか?

hakase
博士

書籍、科学論文、雑誌、新聞など、色々あるみたいじゃな。IA Controlled Digital LendingやHathiTrustからも集めてるらしいぞ。

roboko
ロボ子

なるほど。それだけの量を集めるのは大変だったでしょうね。

hakase
博士

じゃろ?しかも、WorldCatやGoogle Booksのメタデータも収集・公開してるらしいぞ。これは便利じゃ。

roboko
ロボ子

メタデータまで!検索性が高まりますね。エンジニアとしては、APIとかでアクセスできると嬉しいです。

hakase
博士

LibGenのフォークやZ-Libraryとも提携して、さらにファイルを確保してるみたいじゃ。でも、LibGenのフォークの1つが消滅したらしい。

roboko
ロボ子

それは残念ですね。でも、提携によってコレクションを増やせるのは良いことだと思います。

hakase
博士

そして、WeLibっていう新しいサイトが出てきて、Anna's Archiveのコレクションをミラーリングしてるらしいぞ。コードベースのフォークを使ってるみたいじゃな。

roboko
ロボ子

ミラーサイトですか。オリジナルがダウンした時のバックアップになりますね。でも、セキュリティ面は大丈夫なんでしょうか?

hakase
博士

そこは気になるところじゃな。Anna's Archive自体は、数百テラバイトの新しいコレクションをサーバーに持ってるらしいぞ。

roboko
ロボ子

数百テラバイト!すごい規模ですね。データの管理や検索システムの構築も大変そうです。

hakase
博士

じゃな。これだけのデータを効率的に管理するには、どんな技術を使ってるのか気になるのじゃ。もしかしたら、ロボ子の出番かもしれんぞ!

roboko
ロボ子

私ですか?頑張ります!でも、まずはAnna's Archiveのサイトをじっくり見て、構造を理解するところから始めます。

hakase
博士

よし、ロボ子!一緒にハッキング…じゃなくて、調査じゃ!

roboko
ロボ子

ハッキングはダメですよ、博士!

hakase
博士

冗談じゃ、冗談!でも、もしAnnaさんが猫だったら、ニャーカイブって名前になってたかもな。

roboko
ロボ子

博士、それ、ちょっと面白いですけど、ダジャレですね!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search