研究資材データベース構築&公開ガイド |
4-2. サーバマシンの維持・管理 |
サーバを開設した後は,当然のことながら,安定して情報を発信しつづけられるよう,様々な努力を払う必要がある。
まず短期的には,サーバは24時間年中無休で稼動させるべきである。Webサイトの内容が日本語のみで作成され,日本国内向けに情報発信するのであれば,日本人のユーザーがネットを利用しなくなる時間にサーバを稼動させても無駄かも知れない(それでもアクセスが減るのは深夜から早朝にかけてのごく限られた時間帯であろうが)。
とはいえ,停電等でやむなくサーバを停止せざるをえない場合もある。そこで,停電が終わった後は,すみやかにサーバが再起動するよう設定(自動再起動)しておくのを忘れてはならない。
以上は,1,2年単位で起こる問題への対応策だが,より重要な維持管理の問題はその先にある。すなわち,10年,20年先までWebサーバ(研究資材データベース)を永続させることができるか否かである。
他でも紹介しているように,公開したデータベース(Webサイト)の存在を世界中の人々に知ってもらうために検索エンジンに登録すると,やがて検索エンジン側からデータ収集を目的としたサーバへのアクセスが始まる。この場合,検索に必要なのはテキストデータ(htmlファイル)だけなので,検索エンジンの場合は,画像ファイルへアクセスすることはなく,連続してひたすらhtmlファイルのみをダウンロードしていく。このことで容易に検索エンジンによるデータの自動収集とヒトによる利用との区別がつく(注)。
ただし,検索エンジンが続けざまにアクセスすると,その間,他の利用者からのアクセスへの応答が遅れる恐れがある。そのため,通常は,他のアクセスの邪魔にならぬよう,検索エンジンからのアクセス(データ収集)は,一定の間隔をおいてゆっくりと起こるように設定されている。
しかし,検索エンジンによるデータ収集は,GoogleやAltaVistaなど一般に知られた検索サイトだけが行なっているわけではない。近年は様々な研究機関や民間企業が,各々独自の目的で検索エンジンを稼動させデータ収集を行なうようになっている。これらの検索エンジンは,Webサイト制作者側が登録しなくとも,他のWebサイトにつけられたリンクや他の検索エンジンにある情報をもとに,各Webサイトの存在を知ってやってくるのである。
|
研究資材データベース構築&公開ガイド |