原生生物と日本産アリ類の広域画像データベース

4 データベースの構成と利用状況

4-5. サーチエンジンを利用した検索機能の分散化

 そのような問題があるとはいえ,サーチエンジンの出現は,インターネット上でデータベースを作り公開しようとする研究者にとっては,朗報といえる。なぜなら,従来データベースと呼ばれるには,たんにデータを集めただけでなく,ある程度の検索機能をそなえたシステム作りが要求されたからである。しかし,インターネット上では,そのような検索機能を自らはそなえずとも,サーチエンジンがその代用を果たしてくれる。代用というよりは,サーチエンジンの方が機能的に優れている場合が多いので,サーチエンジンに検索をまかせる方がより賢明な道ともいえる。

 実際,原生生物情報サーバでは,既述したように,WarpSearchという全文検索機能のあるcgiソフトを利用して独自に検索サービスを提供しているが,速度的には,外部のサーチエンジンを利用した方がより速く検索ができる。通信速度が遅くても,検索にかかる時間が圧倒的に短いために,トータルの検索時間は外部のサーチエンジンの方が早いのである。

 以上のように,ネットワーク上では,データベースそのものの機能(データの集積,ディスプレイ,検索など)も分散化しつつある。したがって,データベースに関して特別な専門的知識がなくても,データを収集しネットワーク上で公開するだけでデータベースとして十分機能するものが作れるのである。その意味で,今後はより多くの研究者がデータの公開に関心を持ってもらいたいと願っている。

図4-3  サーチエンジンのいろいろ
 アリと原生生物のURLのほとんどすべてが登録されているサーチエンジンのロゴ。各サーチエンジンではRobotというURL 自動収集プログラムを稼働させて各URLのリンクをたどりながら入手可能なURLのすべてを収集している。
 それらをデータベース化し高速の全文検索システムを作って一般に無料公開している。