日本動物学会第68回大会 関連集会

インターネットにおける生物データベースの現状と展望

1997年10月2日(木)18:00−21:00 奈良女子大学 F会場 にて開催予定

<=前の要旨

趣 旨
プログラム
会場案内図

次の要旨=>


原生生物データベース 
  --素材データベースとしての原生生物情報サーバ--

演者:法政大・教養・生物 月井 雄二

素材データベース

 研究者が研究テーマを決め,実験や観察を行なう過程ではたくさんの素材データ(画像や測定値)が生産されるが,通常,論文の中に組込まれ公開されるのはその中のごく一部にすぎない。残された未公開の素材データを広域データベース(ネットワークを介して利用可能なデータベース)化して一般に公開すれば,他の研究者や他分野の人々に役立つ可能性がある(図1)。その実例がDNAデータベースだが,同じことは他の素材データについてもいえるはずである。「原生生物情報サーバ」はそのような原生生物に関する(主に画像を中心とする)素材情報の収集・公開を目的として構築された(http: //protist.i.hosei.ac.jp/index-J.html ;他)。

構築方法

 データの収集は日本原生動物学会会員の協力を得て行なっている。2年程前からネットワークや学会などを通じて,データの提供を呼びかけた。その結果,これまでにデータベース作成グループのメンバーも含めて計10人余の原生生物研究者から画像等の提供があった。

 画像データの提供を申し出た人には,身近にある写真店にスライドを持参し,そのフォトCD化を依頼してもらった。できあがったフォトCDをデータベース作成グループ宛に送るとともに,ディジタル化された各画像の簡単な解説(英文)を電子メールで送付してもらった。

 作成グループ側では届いた英文テキストをhtmlファイルに編集し,届いたディジタル画像とのリンクを張った上で,すべてのファイルをサーバ上に転送して公開した(図2)。

内容紹介

 原生生物情報サーバは,現在,総ファイル数19,000余,総ファイルサイズ 1.7 G bytesである(1997.9.20現在)。原生生物の画像は約140種 2,666枚(ファイル数 13,330)で,残りはレイアウト用の画像と,画像の説明や他のファイルとのリンクを記述したハイパーテキストである。

 原生生物情報サーバにネットワークからアクセスすると図3のような初期メニューが現われる。このうち,上から三番目の「研究資料館」がデータベースの本体である。ここでは各画像や実験マニュアル等が項目ごとに一覧表示形式で閲覧できる。ただし,「研究資料館」には画像の説明はごく簡単にしかないため,一般の利用者にはこれだけではわかりにくいだろうと考え「原生生物図鑑」メニューを追加した。「原生生物図鑑」では原生生物の分類体系に即して「研究資料館」にある画像を紹介している。「原生生物学関連情報」では,データベースとは直接は関係ないが,原生生物学の現状を理解する上で役立つと思われる様々な情報を紹介している。「インターネットと生命科学」では,インターネットの学術的利用価値等について論じた論文や,学術審議会の報告書などを紹介している。

 また,アクセスをしやすくするためにミラーサーバを設置している。設置場所は,石巻専修大学,筑波大学,農水省生物資源研,都立大学,法政大学の計5箇所である。

機能分散型の広域データベース

 以上のように,原生生物情報サーバにはhtmlファイルと画像が置いてあるだけなのだが,これがどうしてデータベースと呼べるのか?と訝る人もいるかもしれない。しかし,インターネット上では,これで十分データベースとして機能するのである。なぜなら,データベースに必要な検索等の機能はネット上に存在する他の専用サーバ(サーチエンジン)が代行してくれるからである。サーチエンジンは各サーバにアクセスして,そこにあるテキストデータを収集し,それらを元に,各サーバ上のデータに対する全文検索サービスを一般に提供している(図4)。

 勿論,検索や並べ替えの機能を自前のサーバに追加することもできるが,餅は餅屋で,検索等の機能はサーチエンジンに分担してもらった方が便利だし,機能的にも優れている場合が多い。

利用状況

 これまでのところ,各ミラーサーバのLogファイルを詳しく分析していないので全体の利用状況は不明だが,法政大のサーバだけだと,今年7月から9月までの3カ月間のファイルアクセス数は約13万5000件(7200 pages)である。これを利用者ごとにみると延べ4123箇所からアクセスがあったことがわかる。その内訳は5割が国内,4割が海外からとなっている(残りの1割は不明)。ただし,ファイルアクセス数の2〜3割は複数のサーチエンジンによるデータ収集なので,実際の利用はこれらよりやや少な目になる。

CD-ROMの配布

 また,データベースの内容をCD-ROM化して一般に無償配布する活動も行なっている。これは,通信速度の遅いネットワーク経由で画像データベースを利用するのは不便である,とくに小中高校などの授業で生徒が一斉にネットワーク経由で利用するには無理がある,また,現状ではネットワークを利用できない人も大勢いる,などの問題をクリアするために始めたものである。データを提供する側にとっても,サーバへの必要以上のアクセスを減らすことで負荷を軽減できること,そしてなによりサーバのbackupになる等,有用な点が多い。CD-ROMはMacintosh, WINDOWS, UNIXにマルチ対応したハイブリッド版を製作した。

 配布は郵送費を節約するために,グループ配布に協力してもらっている。CD-ROM第一版は1000枚を制作し配布はすでに完了している。昨年12末に制作した第二版(5000枚)はこれまでに460人宛に4500枚余を配布している(1997.9.12現在)。

 主な配布先は,大学や民間企業の研究者,および小中高校の教員である。中でも,小中高校教員は各都道府県ごとに研究会・研修会等の組織ができており,それらの組織から配布希望が届いている。このため配布は組織の代表者にまとめて送付し,各組織内でボランティアによる配布が行なわれている。第二版はこれまでに小中高校教員124人宛に2600枚を配布した。その大半は各地区の小中高校に1枚/校単位で配布されている模様である。その結果,CD-ROMの配布は,中高校の教員から教材として有用であるとの反響を得ており,今後このような形での教育分野への情報提供が増えると予想される。


[1997. 9. 27 受理]