研究資材データベース構築&公開ガイド
back 4-2. サーバマシンの維持・管理 forward

維持管理への備え:短期的課題

 サーバを開設した後は,当然のことながら,安定して情報を発信しつづけられるよう,様々な努力を払う必要がある。

 まず短期的には,サーバは24時間年中無休で稼動させるべきである。Webサイトの内容が日本語のみで作成され,日本国内向けに情報発信するのであれば,日本人のユーザーがネットを利用しなくなる時間にサーバを稼動させても無駄かも知れない(それでもアクセスが減るのは深夜から早朝にかけてのごく限られた時間帯であろうが)。
 しかし,学術サイトであれば,可能なかぎり,その内容を国内のみならず全世界を対象として発信すべきことは当然である。したがって,その場合,ユーザーからのアクセスは24時間,かつ1年中,まんべんなく続く可能性が高い,ないしはそうなることを期待すべきである。

 とはいえ,停電等でやむなくサーバを停止せざるをえない場合もある。そこで,停電が終わった後は,すみやかにサーバが再起動するよう設定(自動再起動)しておくのを忘れてはならない。
 また,停電ならばいつかは回復するが,サーバマシンそのものが故障で稼動しなくなる場合もある。以前は,パソコンをサーバマシンにして稼動させた場合,1年以上たつと必ずと言ってよいほど故障したが,近年はかなり性能が向上し容易には故障しなくなった。とはいえ,「備えあれば憂い無し」である。いつかはやってくる突然の故障に備えておいた方がよい。故障してから修理(もしくは交換用マシンの調達)を始めたのでは遅い。可能であれば予備のマシンをあらかじめ用意し,サーバが故障する前に,その中身を予備のサーバマシンへコピー(backup)しておくのが望ましい。
 そうすれば,サーバが故障した場合には,予備のサーバマシンを起動し,そのIPアドレスを従来のサーバと同じに設定すれば,すみやかにサーバを回復させることができる。

維持管理への備え:長期的課題

 以上は,1,2年単位で起こる問題への対応策だが,より重要な維持管理の問題はその先にある。すなわち,10年,20年先までWebサーバ(研究資材データベース)を永続させることができるか否かである。
 これについては将来展望で詳しく説明している。

検索エンジンによるデータ収集への対応

 他でも紹介しているように,公開したデータベース(Webサイト)の存在を世界中の人々に知ってもらうために検索エンジンに登録すると,やがて検索エンジン側からデータ収集を目的としたサーバへのアクセスが始まる。この場合,検索に必要なのはテキストデータ(htmlファイル)だけなので,検索エンジンの場合は,画像ファイルへアクセスすることはなく,連続してひたすらhtmlファイルのみをダウンロードしていく。このことで容易に検索エンジンによるデータの自動収集とヒトによる利用との区別がつく(注)。
注:なかには各Webサイトにある(htmlテキストファイルだけでなく画像ファイルも含めた)すべての情報をダウンロードしていくものもある。これでもっとも有名なのが数年前から活動を続けている Internet Archive である。Internet Archiveでは,ネット上にある情報の多くが短期間で消滅・改変されていくのを危惧し,これらを貴重な歴史遺産として将来に渡って保存し歴史資料として活用しようという壮大な計画の下に活動を続けている。

 ただし,検索エンジンが続けざまにアクセスすると,その間,他の利用者からのアクセスへの応答が遅れる恐れがある。そのため,通常は,他のアクセスの邪魔にならぬよう,検索エンジンからのアクセス(データ収集)は,一定の間隔をおいてゆっくりと起こるように設定されている。

 しかし,検索エンジンによるデータ収集は,GoogleやAltaVistaなど一般に知られた検索サイトだけが行なっているわけではない。近年は様々な研究機関や民間企業が,各々独自の目的で検索エンジンを稼動させデータ収集を行なうようになっている。これらの検索エンジンは,Webサイト制作者側が登録しなくとも,他のWebサイトにつけられたリンクや他の検索エンジンにある情報をもとに,各Webサイトの存在を知ってやってくるのである。
 困ったことには,そのような検索エンジンの中には,上記の「続けざまにはアクセスしない」という検索エンジンが守るべき紳士的ルールを無視してデータ収集を行なうものがある。
 そのような「掟破り」のデータアクセスが起こると,その間は,既述したように,他からのアクセスへの応答が極端に遅くなったり,ときにはまったく応答不能になることもある。このような事態はまれであるとはいえ,これに気がついた場合は,Webサーバ用ソフトにある,そのような検索エンジンからのアクセスだけを拒否する設定を利用するか,直接,その検索エンジンを稼動させている管理者に連絡してアクセスを中止するよう要請するなどの対策をとる必要がある。

back 研究資材データベース構築&公開ガイド forward

Copyright: 2002 Y. Tsukii