Bio-Crawlerによるサイト内検索設定マニュアル |
外部検索エンジンの活用 |
研究者が個人または小グループで Web pagesを作成し,ネット上で公開しようとする際,問題になるのが検索機能をどうやって実現するか,です。ネット上で公開できるデータベースソフトや,サーバと連携した検索用のソフトを使えば自前で検索機能を用意することができますが,これにはそれなりにコストと手間がかかります。 しかし,インターネットは本来,分散処理を得意としますので,検索機能を外部の検索エンジンに委託することもできます。実際,ネット利用者の多くはGoogleやAltaVistaなど一般向けの検索エンジンを使って情報探索を行っていますので,利用者側からすれば慣れ親しんだ検索エンジンの方が使いやすいはずです。 そこで,近年,いくつかの検索エンジンでは,各Webサイトごとの検索サービス(サイト内検索,SiteSearch)を無償あるいは有償で提供するようになりました(例:Google SiteSearchの紹介)。これにより,各サイトの制作者は,検索機能は外部の検索エンジンにまかせて,各自の本来の作業であるWeb pageの作成に専念することができるようになったのです。 しかし,一般の検索エンジンは,広く情報を収集しているため,個々のサイトに対しては網羅的な検索ができない,という欠点があります。学術サイトの場合,網羅的な検索ができることが必須の要件となりますので,データの抜け落ちがあったのでは,学術用としては不適当であると云わざるをえません(注:有償のサイト内検索サービスの場合は,網羅的検索が可能と思われます)。 また,企業のコマーシャルがついてくる場合もあります。これは民間企業が行なう無償の検索サービスとしてはやむをえないことですが,学術サイト用の検索としては好ましくありません。
そこで,農業生物資源研究所では,独自に開発した生物系サイト専用の検索エンジンBioCrawlerを,サイト内検索にも使えるよう様々な改良を行ないました。具体的にどのような改良を行なったかは,つぎのBio-Crawlerについてをご覧ください。
|
Bio-Crawlerによるサイト内検索設定マニュアル |