公開講演会:生物多様性研究・教育を支える広域データベース
原生生物情報サーバ  月井雄二(法政大学)
1 原生生物情報サーバの紹介
back 1-4 原生生物情報サーバの基本構成 back

 以上のように,「原生生物情報サーバ」で基本となるのは,採集(あるいは培養)した各標本(細胞またはクローン,現在約4300サンプル)ごとの画像であり,これらを分類体系にしたがって種,属ごとにまとめて整理してある。

○主なメニュー

研究資料館
http://protist.i.hosei.ac.jp/PDB/menu.html

 標本画像には,メインメニューにある「研究資料館」からアクセスすることができる。ただし,研究資料館にある情報は途中までは日本語と英語の両方の解説がついているが,最終的に辿り着く標本Web pagesは,種の解説から画像の説明まですべて英語で記載してある。これは,日本語版と英語版の両方を作るのが面倒なのと,研究資料館の利用者としては基本的に研究者を想定しているので,利用者が日本人でも研究者なら英語のみでも利用上はさほど支障はないはずとの考えによる(図6)。


図6 「研究資料館」メニュー

 なお,この「研究資料館」をよく見ていただくとわかるのだが,現在は,原生生物だけでなく,多細胞の動物や原核生物の画像もわずかだが公開している。これは原生生物の採集をすると同じサンプルの中にこれらの生物も多数観察されるので,なにげなく撮影を始めたのがきっかけとなった。クマムシやワムシ,イタチムシ,ミジンコといった微小多細胞動物やユレモ,Merismopediaといった原核生物については,当初はまったく知識も興味もなかったが,撮影を続ける間に,原生生物の時と同様,次第に興味が湧き,かつ,ネット上にはこれらの画像を公開しているサイトがほとんどないという事実に気付いてからは積極的に撮影するようになった。今後も可能なかぎりこれらの画像も充実させていこうと考えている。

原生生物図鑑
http://protist.i.hosei.ac.jp/taxonomy/menu.html

 研究資料館は研究者向けに作っているが,ネットワークを介してアクセスしてくるのは研究者だけとはかぎらない。むしろ利用者の大半は研究者以外の一般の人々であるといってよい。そこで,一般利用者へのサービスとして,原生生物の分類に関する簡単な説明と,それに関連した画像を組み合わせた「原生生物図鑑」も用意してある。ただし,これは日本語版のみで英語版は作成していない。その訳は,英語版まで作成する余裕がないというのが一番大きな理由だが,あえて付け加えれば,データベースを構築する上で公的な資金の援助を受けているためでもある(全てではないが,,)。公的な資金とは元を糾せば税金であり,したがって「原生生物図鑑」はスポンサーである納税者への「利益還元」であると位置付けている(図7)。


図7 「原生生物図鑑」メニュー

 原生生物図鑑では代表的な生物の画像のみを紹介しているが,各属ごとの解説のページの最後には,研究資料館にある属ごとのWeb pagesへのリンクも付けられている。各生物群の基本的な特徴を理解して,個々の生物についてより詳しく知りたくなった人のためのものである。

動画データベース
http://protist.i.hosei.ac.jp/Movies/htmls/index.html

 最近は,静止画だけでなく,原生生物の動画データも追加しつつある(研究資料館)。これは,実際に種を同定する際には,たんにその形態的特徴だけでなく「動き」も重要な判断基準になっていることに気づいたためである。従来分類学では形態的な特徴が主な種の判定基準とされてきたが,その訳は,たんに印刷物である学術文献には動画が記録できず,他に動画を記録するための適当な媒体がなかったから,にすぎない。動きのおおまかな特徴は文献に記載できても,文章では表現しようのない微妙な動きは,分類学者の脳裏に記憶されるだけで他に伝達されることはなかった。しかし,ネットワークでは,テキストや静止画だけでなく動画や音も記録できるので,今後,分類学ではこれらの情報も分類形質として利用されていくものと予想される。

 ただし,現在公開している動画は,ネットワークの通信速度を考慮して,もとのDV動画をかなり圧縮している(ファイルサイズは最大で500 kバイト〜1 Mバイト程度)。そのため細部の動きが明瞭ではない。また,時間も短いカットに抑えてあるので,種の特徴を把握する上では不十分かも知れない。だが,オリジナルのDV動画も保存してあるので,将来,通信速度が向上した暁には,これらのDV動画ファイル(数十M〜数百Mバイト)をそのまま公開したいと考えている。

イメージブック(古文献データベース)
http://protist.i.hosei.ac.jp/PDB/ImageBook/menu.html

 静止画や動画の他に,原生生物に関する貴重かつ希少な古文献の画像データベース化も行なっている(図8)。原生生物の分類学研究は19世紀〜20世紀前半にかけて盛んに行なわれた。その結果,原生生物の種に関する記載も半世紀以上前の古い文献にあるものが多い。しかし,これらの古文献は誰もが容易に入手できるものではないため,種の同定をする際の支障になっていた。そこで,著作権の消失した古文献の各ページをスキャナで画像化してWeb ブラウザ上で閲覧できるようにした(研究資料館)。データベース化の手法も公開しているので,他でもこの手法を用いて古文献のデジタル化,ネットワーク公開が進めば,分類学研究がやり易くなるものと期待している。


図8 「イメージブック」メニュー

 この他,「関連情報」「インターネットと生命科学」といったメニューもあるが,長くなるのでここでは省略する。

○Google/Bio-Crawlerを利用したサイト内検索

 データベースと銘打っている以上はなんらかの検索機能があるはずと思われるかも知れないが,「原生生物情報サーバ」は自前の検索機能は備えていない。その替わりとして,外部の検索エンジンを利用した「サイト内検索」という手法を導入している。

 これは外部の検索エンジンを利用する際に,あらかじめ検索対象を自分のサイトのみに限定して検索を行なう方式で,現在いくつかの検索エンジンが有償/無償でこのようなサイト内検索サービスを提供している。ただし,一般向けの検索エンジン(当データベースはGoogleを利用させてもらっている)の場合は,各サイトに対してデータ収集を網羅的に行なっているとはかぎらないので,外部検索エンジンを利用したサイト内検索では検索漏れが起こる可能性がある。

 そこで,昨年度,農業生物資源研究所が運営する生物系の学術サイトに特化した検索エンジン,Bio-Crawler (http://bio-crawler.dna.affrc.go.jp/ )をサイト内検索に利用できるようにする改良プロジェクトにユーザーの立場で協力した。これによりBio-Crawlerを利用した網羅的なサイト内検索ができるようになった。Bio-Crawler では,通常の全文検索の他に,メタデータ(html文の場合はメタタグに記載された情報)の検索もできる。メタデータとしては一般的な Author, Description, Keywordsの他に,生物系独自のものとして Field,Organismを試験的に設定してある。

 「原生生物情報サーバ」は広域分散型公共データベース(DPDD,Distributed Public-Domain Database,参照:Green, D. G. (1994). Databasing diversity - a distributed, public-domain approach. Taxon 43, 51-62. URL, http://life.csu.edu.au/~dgreen/papers/taxon.html )の一つとして構築しているが,ネット上で分散できるのはデータだけでなく,データベースの機能そのものも分散できるのである。「餅は餅屋」なので他に任せられるものは任せて,研究者はデータ作りに専念する方が望ましいと考えている。

 なお,このBio-Crawler を利用したサイト内検索の設定法については,以下のURLで詳しく解説しているので参照願いたい。

___ http://protist.i.hosei.ac.jp/Science_Internet/BioCrawler/index.html

○画像提供者/協力者
http://protist.i.hosei.ac.jp/PDB/contributors_J.html

 既述したように,途中からデータベース構築の目的を網羅的な分類データベース作りにシフトさせたため,最近は自分で撮影した画像が多くなっているが,それだけでなく,これまでにネットを通じて様々な人から多数の画像の提供を受けている。それらの画像はデータベース本体に組み込むとともに,「画像ギャラリィ」(http://protist.i.hosei.ac.jp/PDB/Galleries/index.html)として各提供者ごとに画像を一覧できるようにしてある。

 画像提供者以外にも,ネットを介して,公開した画像を見て同定の誤りを指摘してくれたり,生物名がわからずに公開してあった画像を見て同定を手助けしてくれる人もいる。さらには,「原生生物図鑑」の記載(菌類関係)が古いので新しいものに書き換えてくれた人もいる。

○画像数,ファイル数,データサイズ

 現在公開している画像は静止画 約30,000枚(約490属,1,600種以上,約4,300サンプル),動画 556クリップである。既述したように,静止画は閲覧用のサムネイル画像からモニタでの閲覧用中型画像,印刷用の大型画像まで5段階の異なるサイズのものが用意されている。また,元の画像を加工して説明などを書き加えたものも各属・各種・各標本ごとにある。このため,静止画のファイル数は画像枚数の6倍以上となっている(約19万個)。動画も静止画と同様に利用者の要求に応じて異なる4段階の画面サイズの動画が見れるようにしてある。ただし,公開しているのはごく一部で多くはまだ編集段階にある。

 一方,原生生物図鑑にある解説文用のhtmlファイル,および,研究資料館にある各サンプルごと,種ごと,属ごとの解説と画像を表示させるためのhtmlファイルは,合計で約9,000個ある。そして,これらテキスト,静止画,動画のすべてを合計したデータベース全体のデータサイズは,およそ9ギガバイトほどである。

back I N D E X back