平成9年度知的基盤整備推進制度
「生物系研究資材のデータベース化及びネットワークシステム構築のための基盤的研究開発」
2-1. 生物資材情報発信のためのWWWサーバ構築サポートシステムに関する研究

PREV | NEXT

3.研究成果の詳細内容

3-2. ディジタル画像のデータベースへの組込み,
   および,ネットワーク公開




 得られたデジタル画像を効率的・効果的にデータベースに組み込むためには,トリミング・色調補正・画像サイズの変更などを行う必要がある。さらにそれらをネットワーク上で公開するには,画像圧縮・保存ファイル形式の変更・ファイル名の変更等の処理が必要である。
 トリミング・色調補正・画像サイズの変更などのいわゆる画像処理については,市販の画像作成・編集用のソフトを用いて行った。原生生物については,簡単な画像処理ソフト(GraphicConverter)を使って画像処理を行なったが,アリ類については,必要とされる画像処理を自動的に処理するためのシステムを開発した。
 アリ類データベースでは,トリミング・スケール挿入・縮小率の調整等の画像処理作業を600種類以上のPhotoCD 画像について行う必要があったが,これを実際に人間が手作業で行うのは至難の業である。特に,最適のスケール値や縮小率の調整には計算作業も伴う。そこで,まずアリの専門家が簡単にトリミングや,撮影倍率,回転等のデータを入力できるようにするためのハイパーカードスタックとアップルスクリプトを自作した。さらにそれらの情報に基づいて自動的に画像処理を行うシステムを開発した(下図)。



 データベースを公開するにあたっては,専用の画像データベースソフトを利用することもできるが,その場合は,利用者にも同じソフトを用意してもらうか,データとプログラムが一体型のデータベースにする必要がある。しかし,それらは利用者にとってかなりの負担であり,結果的に利用を制限することになってしまう。
 一方,近年普及してきたWWW形式でデータベースを構築し,ネットワーク公開すれば,専用のブラウザソフトを準備する必要がなく,一般に普及しているWWWブラウザソフトでデータベースが利用できるので,それだけ利用者側からは利用しやすくなる。また,サーバ側に必要な検索等の機能は,外部のサーチエンジンを利用することもできるので自前で検索機能を準備する必要もない(後述)。
 さらに,最近では,パーソナルコンピュータのOSそのものにWWWサーバ機能が内蔵されるようになっており,ネットワーク上でのデータベースの公開は技術的にはますます簡単になりつつある。
 ちなみに原生生物データベースの場合は,オリジナルのPhotoCD画像が約5200枚があるが,各々に画像について5つの異なるサイズのファイルがあるため,ファイル数は約26000個になる。また,それらを加工した画像ファイルは約1000個がある。さらにこれらの画像を組込んでその解説とともにWWWブラウザ上で表示させるためのテキストファイル(htmlファイル)が約10000個ある。

 また,アリ類,原生生物ともにそのhtml ファイルの多くが民間のサーチエンジン(Goo, AltaVista, 等)に登録され検索が可能になっている。当初は自前で全文検索機能を用意していたが,検索速度などの点で外部のサーチエンジンを利用した方が優れていることがわかった。ただし,民間のサーチエンジンは不特定多数のサーバからの情報を収集・データベース化しているため,検索キーに対して同音異義の情報が多数検索されることがある。また,データベースにあるすべてのhtml ファイルが登録されているわけではないため,網羅的な検索ができない,という欠点もある。
 ただし,Gooなどでは,あらかじめ検索する対象となるサイトを限定することができるので,外部のサーチエンジンをあたかも自前の検索エンジンであるかのごとく利用することもできる(参照:http://protist.i.hosei.ac.jp/goo.html,または,http://protist.i.hosei.ac.jp/goo2.html)。しかし,残念ながら上述のように,これらの外部サーチエンジンにはすべてのデータが登録されていないため,サイトを限定しても,網羅的な検索ができないのが欠点といえる。
 以上のような問題を解決するためには,学術専用のサーチエンジンを開発し網羅的な検索ができるようにする必要がある。また,データベース作成者との協議を行ないサーチエンジン側で分野別に情報を整理しやすいようにhtml ファイル作成上の書式などを決めるべきである。


PREV | NEXT