5 研究計画
本研究は,ネットワーク上における学術情報の公開を促進する上で必要不可欠と考えられる2つのシステム,すなわち,公開された情報の学術的価値の評価と,価値が認められた学術情報の恒久的保存のための社会システム作りを目指し,その基礎となる様々な研究を行なう。
当面は,これまで行ってきた日本産アリ類,および原生生物に関する学術情報のデータベース化とそのネットワーク公開を維持・発展させるとともに,「生物形態資料画像データベース」プロジェクトに参加した研究グループやその他分野の研究者と連携して,より広範な学術情報のデータベース化・ネットワーク公開に向けた活動を行なう。
これらの活動によってできた各データベースをモデルケースとし,公開された情報の学術的価値をどうやって評価し,評価されたものをいかに永続的に保存すればよいか,様々な実験的試みを行なう。
平成10年度:
1. 日本蟻類研究会との協同による「日本産アリ類カラー画像データベース」および,我々独自の「原生生物情報サーバ」のネットワーク公開を継続し,内容の充実をはかる。
a) 両データベースについては現在複数のミラーサーバ(計12台)が設置されているが,それらは一つを除いてすべて,パソコン上で稼働している。しかし,利用者の急増,および登録データの増加にともない,次第にパソコンでは対応しきれなくなっている。今後は,処理機能がすぐれたワークステーションにサーバを移行させる必要があり,そのために Sparc Station(2台)を購入する(鵜川・木原)。
b) CD-ROMの製作・一般への配布は,ネットワークを利用できないユーザにもデータベースが利用できる,結果的にサーバへの負荷(アクセス数)が軽減される,さらには,データのバックアップにもなる,など有用な点が多いので,今後もデータの更新があるかぎり改訂版を作成して配布を行なう。CD-ROMはMacintosh, WINDOWS, UNIXにマルチ対応したハイブリッド版を製作し誰でも利用できるものとする。
2. 上記の両画像データベース構築の成果をふまえ,「生物形態資料画像データベース」プロジェクトに参加した研究グループやその他の生物材料の研究グループによる同様な広域データベースの構築に協力する(月井,木原,鵜川)。
a)データの整理・テキスト入力等の指導・支援は,主に月井・木原が担当する。木原は画像データの作成・利用技術の開発・指導も担当する。
b)データベース化された情報のネットワークでの公開作業の支援は主に鵜川が担当する。また,鵜川は,各々の生物に適した検索システムの開発も併せて行なう。
以上のような活動を通じて,研究者が公開した情報の学術的価値を評価し,永続的に保存するためのシステム作りをめざす。具体的には以下のとおりである。
3. 評価システムの試験運用と問題点の検討:すでに民間レベルでは,ネットワーク上で公開されたホームページをカテゴリィごとにランク付けするなど情報の有用度を評価する動きがさかんである。科学関連のホームページのランク付けもなされているが,それらは個人的興味に基づくもので,学術的価値を正当に評価したものとはいいがたい。
本研究では,ネット上で公開された情報の学術的価値を正当に評価する社会システムの構築を目指すが,当面は,生物系の各データベースをモデルケースとしてシステムの試験運用を行なう。それにより,システムを実現する上で障害となる問題点を洗いだし,その解決策を考案する(月井,木原,鵜川)。
4. 学術情報保存のための基礎的研究:現在,インターネット上にある情報は膨大な量となっているが,そのほとんどは学術以外の情報によって占められている。一方で数少ない学術的価値のある情報が,制作者の都合によりいつのまにか消滅していることが多い。学術研究にとって情報の永続性は不可欠の要素である。そこで,ネット上で公開された情報の中から,学術的価値があると認められるものを公的機関が積極的に収集し,バックアップしていく体制が必要となる。
情報の収集には,既存のサーチエンジンが利用できる。サーチエンジンを使ってネット上にある学術情報を探索し,データをまるごと収集してバックアップを作る。このバックアップを基に,オリジナルの情報が消失,または更新された場合に,バックアップにあるデータを引用等に利用できるシステムを構築する。
ただし,そのバックアップ機能を学術研究の全分野に適用するためには,情報発信者である各研究分野・研究グループ・研究者ごとの特殊事情にいかに対応するかが問題になる。また,システムじたいの永続性をどうやって確保するかなど,克服しなければならない課題も多い。本研究では,3と同様に,それらの様々な問題を,生物系のデータベースをモデルケースとして試験運用を行なうことで,基本的問題点を洗いだし,その解決策を検討する(月井,木原,鵜川)。
平成11年度:
基本的には10年度の各研究課題を継続するが,評価と保存の対象を生物系以外の他分野(自然,医薬,工学,人文,社会)へ拡張することに重点を置き,他分野の研究者に協力を求めていく。
考えられる評価と保存のための社会システム
Internetに接続した各個人・グループによるサーバ上で公開された情報を,情報発信支援センター(仮称)がロボットを使って探索し各々の学術的価値の評価を行なう。評価があると認められたものには「認証コード」を発行するとともに,その情報(画像等を含む)を定期的に収集しバックアップ(データベース)を作成する。これにより,各サーバ上のデータが消失・更新された後でもバックアップが残るので,認証コードを参照することにより消失・変更以前の情報を引用できるようになる ( 詳しくは http://133.25.20.31/SupportSystem/menu.html を参照)。
本研究では,認証コードを発行するまでの手続き,及び,情報を収集しデータベース化する際に必要となる分野識別用タグやキーワードの付け方等,基礎的なルール作りを行なう。