ndl-japan-research-robot-1.1

久しぶりにレンタルサーバアクセスログをチェックしてみたら、ユーザエージェントの統計に、「ndl-japan-research-robot-1.1」という見慣れないものが 5 位になっていた。ロボットの名前の後ろに URL が書いてあったのでアクセスしてみると、それは「国立国会図書館について」というページだった。国立国会図書館??
そういえば以前、Internet Archive のようなことをやろうというような計画の報道がされていたような気がする。その関係なのかしら。
電子図書館プロジェクト:電子情報の長期的な保存と利用によれば、

この他にも、ネットワーク系電子出版物(インターネット情報等)についても、選択的な収集を開始しています。

と書かれているから、この「選択的な収集」が行われているということなのかな?
電子図書館中期計画2004にも、

(2) ウェブ・アーカイビングと提供
 当館はインターネット上の情報資源の収集・保存・提供実験を行っている。

とある。ロボットがアクセスしてきていることから、収集はしているようだけど、「提供実験」というのはどこでされているのだろう。
少し探してみると、国立国会図書館インターネット資源選択的蓄積実験事業(WARP)というのを見つけた。上で説明されているのはこの実験事業のことなのかな。が、本事業の紹介(WARP)には、

本事業の趣旨にご賛同いただける機関を対象に、さまざまなウェブサイトを技術的に可能な範囲で収集し、 国立国会図書館において蓄積・保存しています。

とある。「本事業の趣旨にご賛同いただける機関」が対象ということだから、うちは対象ではないのかもしれない。さらに下を読んでいくと、

[WARPの手続き]
(中略)
3. 当館より、管理責任者様宛に、収集許諾依頼文書を発送します。

とあることから、収集する前には「承諾依頼」があるということになる。これまでのところ、そのような依頼は受けていないから、やはり対象ではないのだろう(レンタルサーバを借りているので、サーバ管理者に依頼がいっている可能性もあるが、「ウェブサイト管理者」と書かれているからおそらくそれはないだろう)。そうすると、このロボットはこの実験事業とは別のものなんだろうか。あるいは、単に巡回しているだけで収集はしていないのか?
あ。WARP における収集の仕組みについて (PDF)には、エージェント名は「ndl-japan-warp-0.1」だと書かれている。ロボット名が違う、ということはこの事業とは関係なさそうだ。とすると、なんの巡回だろう。ロボット名に「research」とあることからなんらかの調査なのだろうけど、謎だ。