日本動物学会第68回大会 関連集会

インターネットにおける生物データベースの現状と展望

1997年10月2日(木)18:00−21:00 奈良女子大学 F会場 にて開催予定

<=前の要旨

趣 旨
プログラム
会場案内図

次の要旨=>


学術データベースの
サポートシステムの確立 

演者:法政大・教養・生物 月井 雄二

理想と現実

 インターネットを媒体として情報発信する場合,印刷における紙数制限のようなものはない。事実上無制限に情報を発信できる。また,文字や画像だけでなく動画や音声等,ディジタル化できるものであれば何でも扱える。このため,インターネットは,従来の印刷メディアでは扱いきれなかった学術情報,とりわけ写真や測定値など研究の過程で生産される膨大な量の素材データを公開する有効な手段となりうる。その実例がDNAデータバンクであることは周知のとおりである。他の生物系の学術情報については,画像が中心のため従来はディジタル化・データベース化が難しかったが,近年のマルチメディア技術の進展にともない,そのような技術的障壁は克服されつつある。したがって,今後はDNA以外の生物系素材データの公開が期待される。

 ただし,DNAと他の素材データとではその性質の違いから,データの公開・維持管理の仕方にも違いが生じると予想される。DNAの場合は,データが均質であり,ホモロジー検索など高度なデータ処理を考えると集中管理した方が望ましいし,またそれが可能である。一方,他の生物系素材データの多くは,種類やサイズが多様かつ膨大であるため集中管理は無理で,研究者ないし研究グループごとにサーバを公開する分散型にならざるをえない。誰もが情報発信者になり得るというインターネットの性格を考えると,その方がより自然な姿でもある。広範な研究分野において,そのような形での学術情報の公開が実現すれば,結果として,生物学全分野を網羅する広大な分散型広域データベース(Distributed Public Domain Database)が誕生することになる。それは,今後の生物学の発展に重要な役割を果たすだろう。

 とはいえ,現状はなかなか期待通りには進んでいない。生物系のデータに関しては,公的機関が公開しているものを除くと,一般の研究者・研究グループが自らのデータ(学術情報)を公開している例は少ない。ネット上を探索すると,生物学関連の情報公開はあるにはあるが,そのほとんどは残念ながらパンフレット程度の内容か,もしくは個人の趣味的な範囲に留まっており,学術資料としての利用を考えて公開されているものは稀である(参照:「学術標本画像データベース作成の指針」)。

評価とバックアップシステムの必要性

 いうまでもないことだが,研究者は,自分が産み出した学術情報(発見や考え)をより多くの人々に知ってもらう(すなわち情報発信する)ために日々努力を重ねている。これまでは,そのための情報媒体として,主として印刷メディアが利用されてきた。しかし,近年になって登場したインターネットは,現在1億人近い利用者を抱え,そこでの情報の伝達効率や反響の即時性を考えると,印刷メディアをはるかに上回る情報発信機能をもつといえる。したがって,これを利用して情報を発信し自らの存在をアピールすれば,研究競争の上で優位に立てるはずである。また,科学全体からみても,ネットワーク上で情報を公開することは,上記の分散型広域データベース(DPDD)の実現につながるだけでなく,様々な点で研究・教育環境を向上させると期待できる。

 以上のように考えると,研究者によるネットワーク上での情報発信が盛んになってしかるべきなのだが,現実には,既述したように期待するほど盛んではない。これは何故だろうか?

 考えられる理由としては,多くの研究者が,まだインターネット上での情報発信に馴染んでいないということもあるだろう。しかし,一番の問題は,評価とバックアップ体制の欠如にあると思われる。印刷媒体上で学術情報が公開される際には,多くの場合,事前に内容の評価が行なわれ,学術的価値の認められたもののみが掲載される(そしてそれは研究者の"業績"となる)。また,出版された学術情報は大学図書館等で恒久的に保存されることで,研究の継続性が保証されている。これらの社会システムはいずれも学術研究には必要不可欠のものである。しかし,ネット上で公開される学術情報については,いまだそのようなしくみは存在しない(例外がDNAデータバンク)。評価も保存もされなければ,研究者が学術情報をネット上で公開しようとする意欲が生じないのは当然である。

 DNAデータバンクの場合は,公的な機関が収集したデータの公開と保存を同時に行なっているので,当面は問題ないだろう。しかし,他の素材データの場合は,情報公開を研究者・研究グループが自発的に行なうのはよいとしても,そのような個人ないしグループに,データの恒久的な保存まで期待するのは無理である。実際,インターネット上で公開される情報の多くは,学術的であると否とに関わらず,いつのまにかなくなっていることが多い(平均40日で消失するという調査結果もある)。また,消失しなくとも,研究の進展にともないデータが更新されることは当然ありえるが,更新されてしまうと,出版物の場合のように学術資料として引用できなくなるという問題も起こる。

 そこで,今後必要になるのは,それらの分散したサーバ上で公開されている学術情報を定期的に収集しバックアップするシステムである。これは現在すでにあるサーチエンジンの機能をそのまま利用すればよく,技術的にはすでに十分可能である。ただし,ネット上にあるデータは玉石混交であり,学術的価値のあるデータはごく一部でしかない。そこで,公開されたデータの中から学術的価値のあるものを選び出し(=評価),それらのみを年単位でバックアップする必要がある。そのような評価と保存の作業を行なう公的機関の設置が望まれる(下図)。

社会に直接開かれた学術研究のあるべき姿

 インターネット上で公開された情報は,基本的には誰でも利用できる。これが学術研究にもたらす影響についても考える必要がある。

 本来,学術研究は公共のものだが,現実にはその専門性の高まりととともに,一般社会からは隔絶されてきた。従来の印刷メディアでは,一部の一般受けのするものは別として,専門性の高い内容の論文や書籍は,通常,同じ分野の,あるいは共通の研究テーマを持つ研究者の間でしか行き渡らない。実際,多くの学術雑誌が一般の書店や街中の図書館に並ぶことはほとんどない。専門家が読む雑誌はその専門家が所属する研究機関にしかない場合が多い。そして,そのような印刷メディアの地理的な配置じたいが,ますます一般の目から専門知識を遠ざける結果をもたらしている(その溝を埋めるために科学ジャーナリズムが登場してきた)。

 しかし,インターネット上で情報を公開した場合,状況は一変する。インターネット上で公開された情報については,その専門性のいかんに関わらず,また内容を理解できるか否かに関わらず,基本的には誰でも自由に閲覧できる。これは,従来あった地理的ないし物理的な「情報の障壁」が存在しないことを意味し,今後,科学の在り方に大きな影響を与えると予想される。

 問題は,そのような状況にどう対応すべきかである。専門的な内容を一般向けに分かりやすく解説する必要もあるだろうし,一般からの問い合わせに直接返答するなどの事態も起こり得る。それは,研究者にとって負担になることは確かだが,対応する方が望ましいし,本来はそうあるべきである。

 なぜならば,

1)本来,学術研究は公共のものであり,より広く知ってもらうことは,研究者が望んでいることでもあるはずだからである。

 また,

2)研究資金の出所の多くは税金であり,したがって,学術研究のスポンサーは一般市民(納税者)である。研究者はそのスポンサーに対して自らが行なっている学術研究の正当性を理解してもらう必要がある。ネット上での学術情報の公開はそのための極めて有効な手段といえる。


[1997. 9. 27 受理]