公開講演会:生物多様性研究・教育を支える広域データベース
牧野標本館タイプ標本データベース
 木原 章(法政大学 自然科学センター),加藤英寿(東京都立大学 牧野標本館)
back 3.データ構造と他のデータベースとの連携 back

 データベース構築を始めるにあたって,どの情報を選択しどのような項目設定でデータベースを構築するかという問題は,「概念設計」と呼ばれる作業である。どんなデータベースも初期の概念設計をそのまま維持しながら,データを入力し続けるのは難しく,予想しないデータの出現や,逆に無意味な項目設定等が,次第に明らかになってくる。しかし,いったん決めたデータ構造を,いつどのような理由で諦めて,新たなデータ構造を目指せば良いのだろうか?

 牧野タイプ標本データベースを作製する段階でも,初期は,1標本,1ラベル,1画像として,一つのデータテーブルで管理する予定で作業を開始した。しかし,実際には画像に関しては標本に対して1:Nの関係を作製したほうが柔軟に対応できることが判明し,データ構造の変換を行った。更に,現在タイプ以外の標本をデータベース化する作業を開始したが,その場合には標本対ラベルの関係も1:Nになる。そうなると,新たに標本対ラベルの関係性も見直す必要が出てくるのである。

 一方で,現在世界では植物標本を始めとする標本データベースの作製が盛んに行われるようになってきた。やがて,個々のデータベースは連携して地球規模の生物標本データベースが完成する日も間近である。その時,個々のデータベースで作られた個々の構造は,どのように連携すれば良いか?その手続きを考えると今作り始めるよりも,もう少し安定した構造が確定するまで,作業を待ったほうが得かもしれないと,ついつい思われがちである。しかし,その考え方は正しいとは思えない。我々のデータベースの作製過程を見ても,既存の標本の鑑定,整理,保管と言う初期の手続きに一番時間がかかり,いったん整理された情報を入力するスピードは,はるかに前者を上回っている。また,データベースは作製途中で,いずれにしても構造の変更を求められるものである。更に,いったんデジタル化された情報を新たな構造に対応させることは,決して難しい作業でも無い。

 牧野タイプ標本データベースは,現在,JST(日本科学技術振興事業団)のBRNetの「生物系研究資材共有データベースシステム」( http:// bio.tokyo.jst.go.jp: 8080/ jstapp/ owa2/ jst_top_page.main_page ) にも登録されている(図9)。これら2つのデータベースは,データ構造が必ずしも一致していないが,いったんデジタル化された文字情報は,様々な変換手段で再利用可能である事を示す良い例である。画像データに関しては,サーバーの能力とも関わるので,プライマリのサーバーを決めたら,その画像情報へのリンク(URL)として他のデータベースで転用する事が可能である。
図9 BRNetの検索結果画面

 つまり,他のデータベースなどとの連携も含め,データ構造をめぐる問題は継続的に発生しうる事であり,そのことを気にするばかりにプライマリのデータベースが完成されないという事では,多くの情報をデータベース化することは望めないとものと考えて前に進んでいるのが現状である。

back I N D E X back