すげー大風呂敷のような - 俺様何様 − 腸をぶちまけて死ぬのだ。

インターネットのホームページ上などに膨大に蓄積されながら、ときには短時間で更新、削除されてしまうウェブページをきめこまかく保存して一般に公開する「平成国立インターネット図書館」（仮称）の構築に、総務省と国立国会図書館が来年度から共同で取り組むことが二十六日、明らかになった。手軽な更新作業で最新の情報内容に変わっていくさまざまなホームページ上の情報には、資料価値の高いものも含まれているためで、総務省は平成十八年度の実用化を目指す。

これって下手すると一種のDoS攻撃になりかねんような。どうやって更新を検知するんだろう。ポーリングするしかなくないか？削除されたページって、現状ではGoogleのキャッシュが主な手段になっていますね。

しかし削除されたページの利用って、どうなるんだろう。例えば名誉毀損とされて撤回されたページとか、少年犯罪で実名を晒したページとか。そういうのも全部保存されちゃって、閲覧できるわけだよな。あるいは誤って公開されてしまった個人情報とかさ。

それはいいとして、「３００億円かけ１０００兆バイトの巨大サーバー」って。単位をバイトにせんでいいだろ、報道なんだから。広告とかなら「2000g増量！」とかでもいいけど。

ちなみに１０００兆バイトってのは。

１兆キロバイト (kB)
１０億メガバイト (MB)
１００万ギガバイト (GB)
１０００テラバイト (TB)
１ペタバイト (PB)
０．００１エクサバイト (EB)
０．０００００１ゼタバイト(ZB)
０．００００００００１ヨタバイト (YB)

となります。

うーん、さすがに１ペタバイトだと有り難みがないなあ。