研究資材データベース構築&公開ガイド
back 4-1. Webサイトの周知法 forward

 ネットワーク(インターネット)に接続したコンピュータ上でWebサーバを稼動させたからといって,それだけでは実際に公開したとはいいがたい。そこにどのようなデータがあるかを世界中の人が知りうる状態にならなければ,結局,誰もアクセスしてこないからである。

 Webサーバの存在を世界中に知らしめるもっとも一般的な方法は以下の2つである。
 1)検索エンジンへのデータ収集依頼
 2)ディレクトリサービスへの登録

 この他にも,すでに周知されている大学や研究機関のWebサイト(いわゆるホームページ)にお願いしてそこからリンクをはってもらえば,やがてはそのリンクを辿って利用者がアクセスしてくるかも知れない。しかし,一般的にみて,特定の生物に関する情報を探索するために,わざわざ大学や研究機関のホームページにアクセスしてくる可能性は少ないはずである。

 一方,検索エンジンは,収集した各htmlファイルにあるリンクを参照して他のhtmlファイルを手に入れるという,いわゆる「芋づる式」にデータ収集を行なっている。このため,上記のように,大学などの研究機関のホームページにリンクをはっておけば,後は何もしなくとも,やがてそのリンクを辿って検索エンジンがやってくることもある。

 とはいえ,それらはあくまで可能性であって,そのような人まかせでは,検索エンジンからのデータ収集がいつ始まるかわからない。そこで,もし少しでも早く,より多くの人々にその存在を知ってもらいたいのであれば,Webサイトの制作者自身が,積極的に各検索エンジン(Google, AltaVista, Inforseek, Goo<国内>など)や,あるいはそれらと連携していることが多い,ディレクトリサービス(Yahooなど)にWebサイトの登録ないしはデータ収集依頼を行なうべきである。

学術サイト専用検索エンジンの有用性

 ただし,ここにひとつの問題がある。それは,学術情報の検索においては網羅性が必須の要件となるが,一般の検索エンジンに網羅性を期待することは難しい,という点である。
 一般の検索エンジンは世界中にあるWebサイトからデータを収集しようとしているため,個々のサイトに関しては,すべての情報が収集できているわけではない。検索エンジンの処理能力にもよるが,多くの場合は一部にかぎられている。
 また,現在ネットワーク上で公開されているweb 情報は作成者の自由な発想で記述されているため,いわゆる統制語彙を含んだメタデータは使われていない。このため,一般の検索エンジンでは統合的,体系的な検索を行なうことはできない(詳細は別紙)。

 既述したように学術情報の検索においては,網羅的,かつ統合的な検索ができることが必須の要件となる。このため,学術データベースの検索においては,その網羅性を確保し,統合的,体系的な検索を可能にする学術サイト専用の検索エンジンを育成していく必要がある。「育成」という言葉を用いたのは,そのような学術サイト専用検索エンジンを実現するためには,たんに検索エンジンの制作者側が一方的にプログラムを制作すればできるというものではなく,統制語彙の採用などデータベース作成者(研究者)側の協力が不可欠だからである。
 そのような検索エンジンをめざしたひとつの試みとして,生物系Webサイトに特化した検索エンジン,Bio-Crawler(農業生物資源研)がある。Bio-Crawlerに関しては以下のURLに詳細がある。

 Bio-CrawlerのURL
 Bio-Crawlerによるサイト内検索設定マニュアル

back 研究資材データベース構築&公開ガイド forward

Copyright: 2002 Y. Tsukii