インターネットを利用した生命科学情報の広域データベース化とその意義
日本産アリ類カラー画像データベースの紹介
3.Distributed Public Domain Databases
これらの広域データベースのうち,遺伝情報データベースは扱う情報量が多いこともあり特定の専門機関がデータを収集し,ネットワークを通じて多くの利用者へ情報を提供する形をとっている【6】。そこではデータの管理者(サーバ)と利用者(クライアント)は完全に分離している。しかし,多種多様かつ膨大な量の生命科学情報のすべてを専門機関がデータベース化するのは不可能である。
そこで最近目だっているのは,研究者自らがサーバを管理し各自のデータをネットワーク上で公開して相互に利用しあう形態の広域データベースである。そこではデータベースの利用者が同時に管理者(もしくはデータの提供者)でもあるわけで両者の区別はない。そのような研究者間の連携により,複数のホストコンピュータが相互にリンクしてサーバ分散型のデータベースを形成している。これがDistributed Public Domain Databases(DPDD)である【7】。
DPDDとしては,現在はGopherサーバを利用したものが多い。Gopherサーバは他のサーバとのリンクを簡単に設定することができるため,関連するGopherサーバどうしが次々とリンクすることにより自然にサーバ分散型の広域データベースができあがる(上記参照)。
また,最近はより使いやすく高機能なWWW(World Wide Web)サーバが急速に増えつつあり,これを利用したDPDDもある。例えば,アリゾナ大のWWWサーバ「The Tree of Life」( http://phylogeny.arizona.edu/tree/phylogeny.html )では,全生物界の系統樹の骨格部分を構築し,自分達が研究している生物の情報をその系統樹にしたがって提供するとともに,他の生物関連のWWWサーバがその系統樹の該当する部分へリンクすることを呼びかけている(図1)。これは全世界に分散した生物学関連のWWWサーバのもつ情報をアリゾナ大のサーバ上に構築された系統樹に関連づけて統合しようという壮大な試みである。
Broadcast or perish
インターネットの最大の特徴は,全世界で相互に接続された300万台のコンピュータすべてが各々ホストとして情報の発信機能をもつことにある。したがって,どんなにちいさなパソコンであってもそれをサーバとして稼働させれば,原理的には全世界のホストコンピュータ,および,それを利用する人々に向けて情報を発信することができる。インターネットは従来の1対多&一方通行のマスメディアとは異なる多対多&相互交信可能な新しいメディアなのである。DPDDは,その新しいメディアとしてのネットワーク機能を最大限に活用したものといえる。
今後,DPDDおよびこれに類するものが普及すれば,科学のあり方が基本的に変わる可能性がある。なぜなら,DPDD等の普及は科学雑誌など従来のメディアが果たしてきた公報(Broadcasting)機能を研究者自らが持つことを意味するからだ。その結果として,研究情報の公開・共有システムが基本的に変わらざるをえなくなる。かつて研究競争の激しさを表す「Publish or perish」という表現が流行したことがあるが,「Broadcast or perish」,すなわち,研究者自らが自らの情報(論文など)をネットワーク上で公開するか,さもなければ研究者として自滅するかの時代が来る,のかも知れない【8】。
以下ではDPDDとして生物分類情報データベースの構築が急務であること,そして,その一例として我々が構築中の日本産アリ類カラー画像データベースを紹介する。
もどる すすむ
Copyright 1995 by 日本コンピュータサイエンス学会