公開講演会:生物多様性研究・教育を支える広域データベース
日本産アリ類画像データベース  今井弘民(国立遺伝学研究所 / 総合研究大学院大学)
アリ類画像データベースの特色
back 3. データベースの鍵を握る検索システム back

 (3-2)アリで試みた各種検索方式

  「クリック& オープン方式」を効果的にするためには,データベースの元になる素データ(例えば種名,属名,科名,画像,分布,記載等のファイル)を互いにリンクさせ,必要な項目をクリックすればその項目に飛ぶようにすることで,より深みのあるデータベースを構築することができる。アリ類データベースでは,クリックして最終的に行き着くのは「電子アリ図鑑」である。この図鑑には,和名・学名・シノニム・種の記載・文献・分布・県別分布図・3方向(背面・側面・正面)画像をセットにして,種毎の分類情報が網羅されている(図5)。そしてどの入り口から検索しても,3回以内のクリックで電子アリ図鑑に行き着くように工夫してある。


図5a 電子アリ図鑑の基本画面

URL, http://ant.edb.miyakyo-u.ac.jp/Taxo_J/F80903.html
和名,学名,分類位置,3方向(背面・側面・正面)の画像(スケール付),原記載,シノニム,解説,分布,解説担当者名,学習図鑑関連ページのデータがある。また,「表示項目を選ぶ...」から「生息分布図」「画像一覧」へリンクしている。

図5b 拡大図

URL, http://ant.edb.miyakyo-u.ac.jp/PCD0232/HTML/08.html

図5c さらなる拡大図

URL, http://ant.edb.miyakyo-u.ac.jp/PCD0232/C/08.jpg

図5d 生息分布図

URL, http://ant.edb.miyakyo-u.ac.jp/Map_J/F80903.html
日本蟻類研究会のメンバーが調査した各種ごとの分布データをもとに作成した県単位の分布図。

図5e 画像一覧

URL, http://ant.edb.miyakyo-u.ac.jp/Photo_J/F80903.html
基本画面だけでなくデータベース内にあるこの種に関連したすべての画像を見ることができる。

 しかし手作業による単純なリンク方式は,データ数が数百程度の少ない場合には効果的であるが,データ数が数千から数万になると破綻をきたす。実際95年版アリ類データベースはこのリンク方式で作成して成功をおさめたが,リンクを張るのが手作業のため,98年の英訳改訂版の際に数万件におよぶリンク網を張り替えることができなくなって破綻に追い込まれた経緯がある。

 手作業リンク方式に替わって98年版に採用されたのは,Fコードをベースにしたリレーショナル方式であった。この方式は,アリの種をF10101など5桁の認識番号で整理し,ファイルメーカーなどのカード型データベースソフトを使って全ての素データファイルをこの番号を通じて管理する方式で,自動的に電子アリ図鑑を作成したり,種属科などの分類学的階層間を自在に素早く行き来出きる点で大変優れた方式である。しかし,Fコード・リレーショナル方式にも弱点がある。それは分類データベースでは頻繁な種名変更に伴って常にデータの改訂が必要になるが,データの管理システムが複雑で高度な職人技が要求されるため,分類研究者が自分たちでデータ管理できないことである。

 分類データベースは,最終的には分類研究者自身の手でデータの更新ができる方式が望ましい。このことを念頭において今回2003年改訂版では2つの新しい試みを行っている。一つは,オーストラリア産アリ類画像データベースでの試みで,分類研究者が作成した従来のチェックリストをMicrosoft Wordのまま読み込み,文字列のパターンや並びの規則性から各種の分類情報を切り出してデータベース化し整列表示する方式である。閲覧したい情報(種・属・亜科・シノニム・画像)の項目ボタンを用意し,クリックすると該当する項目の内容が見えるようになっている。この方式のメリットは,電子化されたチェックリストを分類研究者がいつでも自由に改訂できる点にある。どんなに内容が変わっても,その都度パターン切り出し方式で必要な情報を抽出して表示するので,Fコード・リレーショナル方式のようなデータ改編に伴うシステムの破綻が生じない。

 もう一つは,アリ類データベースの長年の夢であったファジーマトリックス検索である。まずファイルメーカーを用いて学名・和名・分布・形態的特徴・習性など分類検索に必要な情報を網羅した項目一覧表を作成し,種毎にyes/no, +/-,または数値を記入した一覧表(マトリックス)を作成する。次に各項目を簡略化したキーワードの一覧を別途用意してマトリックスとリンクさせる。検索は,キーワード一覧の中から適当な項目を選びデータ(例えば,体長:6 mm,胸の色:赤,生息場所:高山,習性1:塚をつくる,習性2:蟻酸を出す,等々)を入力して検索ボタンを押すと,その条件を満たすアリの候補がヒット確率の高い順にエゾアカヤマアリ,ツノアカヤマアリ....のように表示される仕組みである。従来の分類検索は,形態的な特徴のみが用いられてきたが,マトリックス検索では,その他に生態学的(分布・習性)や遺伝学的(染色体)な情報も網羅しているので,アリの分類をまったく知らないユーザーが専門的な知識なしに色々な側面から検索することが可能になる。分類データベースとして将来の発展が期待される方式である。

 このほかに文字の代わりに画像を用いたイメージ検索も捨てがたい魅力がある。これは,アリの背面図の見出し画像一覧を用意し,検索しようとしているアリに似た画像を選んでクリックするとそのアリの電子アリ図鑑に飛ぶようになっている。例えば,検索画面に日本地図を北海道・東北・関東など地域別に色分けして表示しておき,それぞれの地域に生息するアリの見出し画像を「最普通種」「普通種」「稀な種」など頻度順に並べておくことで,イメージ検索を効果的に使うことができる。また体の顕著な特徴,例えば刺がある・腹部末端に針を持つ・腹部が鉤状に曲がっている,などを線画やカラー画像を用いて示すことにより,文字だけでは明確に判断できない形質をより正確にユーザーに伝えることができる。


図6a イメージ検索/形態優先表示

URL, http://ant.edb.miyakyo-u.ac.jp/Find_J/IMG_frq.html

図6b イメージ検索/サイズ優先表示

URL, http://ant.edb.miyakyo-u.ac.jp/Find_J/IMG_frq.html

 以上検索方式には様々な可能性があることがお分かりいただけたと思う。それぞれ長所と短所があるので,その特徴を熟知して複数の検索方式を組みあわせて使うことで,同じデータベースを用いて幅広いユーザーがそれぞれのニーズに合わせて学術用にも教育普及用にも利用できるようになる。データベースの出来不出来は,データの中身もさることながら,検索の善し悪しが決め手といっても過言ではない。アリ類データベースが公開以来長期にわたって人気がある秘密は,高品質画像に加えて多彩な検索方式を駆使している点にあると思う。とにかくクリックすれば何か出てくる。次に何が出てくるか?という期待感につられて,ゲーム感覚であちこち見て歩くうちに知らずしらずにアリの知識が身に付いてゆくのである。

 しかし忘れてはならないことは,ユーザーの便宜を図ることも大切であるが,それ以上に大事なことは,データベースの作り手(今の場合分類研究者)がデータの管理を自分で行えるようなシステムにすることである。アリ類データベースでは,試行錯誤の末今ようやくそんな理想的なデータベースを手中にしたところである。

back I N D E X back