公開講演会:生物多様性研究・教育を支える広域データベース

日本産アリ類画像データベース
http://ant.edb.miyakyo-u.ac.jp/HTMLS/INDEX.HTM
- 理想を追い求めて -
今井弘民(国立遺伝学研究所 / 総合研究大学院大学)

なぜか人気が衰えない

 アリ類データベースは,日本産のアリ類の検索と同定を目的に開発された分類データベースで,インターネットが普及し始めた1995年からWeb上に公開している。内容は非常に専門色の強いデータベースであるが,高品質画像を用いた電子アリ図鑑を中心にユーザーのニーズに合わせた各種検索方式の採用と,初心者向けに学研の写真図鑑「アリ」をデジタル化したメニューを搭載している。このため,アリの専門家だけでなく小学生や家庭の主婦も含めた幅広いユーザーが利用できる学術・教育両用データベースになっている。また98年に英語版を公開してから,海外からのアクセスが年々増加している。その人気のほどは,2002年11月末までの総アクセス回数が約3,800万回(本年8月には190万回/月を記録,その6-7割が海外から),およびリンク許可件数530サイト以上という驚異的な数字を見ればお分かりいただけると思う。


図1 日本語版メインメニュー

URL, http://ant.edb.miyakyo-u.ac.jp/

図2 英語版メインメニュー

URL, http://ant.edb.miyakyo-u.ac.jp/INDEXE.HTM

 世界に1万種知られているアリのうち日本のアリはわずかに273種,しかもほとんどが1-6 mmと小さくて見映えがしない。そんなアリのデータベースがどうしてこのように世界の人々から注目されるのだろうか?理由は後ほど述べるとして,ともかく,これだけ大勢の人々が利用しているという事実は,データベースが生物分類学の新しい情報媒体として無限の可能性を秘めていることを示唆しているように思われる。

分類学の新しい潮流と日本の実情

 分類学といえば,ヨーロッパの列強が7つの海を制覇した大航海時代には自然史科学の華であった。しかし近年,特に日本では,分類学は著しく衰退して社会から乖離しつつある。このことは分類研究者自身が危機感を感じているようで,最近「地球規模生物多様性情報機構(GBIF)」という国際的科学協力プロジェクトが立ち上がり,分類学の活性化が試みられていることからもうかがえる。その目的は「各国の大学や博物館に収蔵された生物標本の分類データベースを構築して世界の人々が利用できるようにする」ことにある。

 日本はこの国際プロジェクトの事務局運営ために米国と並んで70万ドルという高額の資金を提供している。一方各国のデータベース整備は各国が自前でおこなうのが原則で,欧米諸国は分類学が生き残る最後のチャンスと,国家事業として潤沢な予算を投入してタイプ標本を中心とした分類データベースを立ち上げつつある。日本では科学技術振興事業団(JST)が受け皿になって,国立大学や主要博物館を中心にGBIF-Japanが組織された。しかし,昨今の国立機関の独立行政法人化と予算削減の余波で,計画はスタート前から頓挫してしまった。

 内情はさておき,平成15年度のGBIF会議の日本開催が決まっている。開催国として日本の分類学の水準を世界にアピールするよいチャンスである。日本では植物分類が比較的しっかりした組織をもっているようで,乏しい財源をやりくりして東大と科博に集中的に予算投入されることになった。これに対して動物分類はリーダー不在で力がでないようである。しかしいずれにしても,日本ではタイプ標本の整備が著しく遅れており,種数や収蔵場所一覧などの分類情報調査が分類学会を中心にこれから始まろうとしているのが実情である。

分類データベースは分類研究者だけでは構築できない

 分類データベースの構築には,基礎資料としての分類情報の他に,どんなデータベースを構築したいかというビジョンと,そのビジョンをコンピュータ上に実現するシステム構築技術が不可欠になる。アリ類データベースで特筆すべきことは,メンバーに分類研究者以外に生物情報学の研究者が加わり,リーダーが染色体進化を専門とする遺伝畑出身という異色の組み合わせにある。

 遺伝学と分類学との結びつきは奇妙かもしれないが,実は意外に切実な関係があるのである。というのは,いくらアリの染色体を観察しても,アリの学名が分からなければ論文を発表することができないからである。だから実学としてのアリ類分類学の整備の必要性は分類研究者以上に切実な問題であり,結果として分類学研究者とは一味違う分類学のユーザーとしてのビジョン(と言うか夢)に基づいたデータベースができたのである。さらに生物情報学メンバーは,生物分類の知識を持つと同時にコンピュータも操れるという点が重要で,これが純粋に情報工学出身のシステムエンジニアでは必ずしも戦力にならないのである。

 言うまでもなく,アリ類データベースはアリ類分類研究者の知識なしには存在しえない。しかし,分類研究者だけであったら日の目を見なかったことも確かである。というのは,従来の分類研究者は個人プレーが多く,大勢で共同して研究を進めることを嫌うからである。ずばり言えば「自ら新種を記載しモノグラフを出す」のが生きがいで,記載前に秘蔵の標本を人に見せることは絶対にしない(したら取られるから!)。さらに分類研究者は分類の命名規約に絶対的に忠実で,非情なまでに種名のプライオリティを追及する性癖がある。同一種に複数の名前がつけられた時,先に付けられた名前にプライオリティがある。このこと自体別に問題はない。問題は,ある標本が同一種か別種かの判断が分類研究者によって見解が異なることである。この意味で分類学は主観の強い学問である。いずれにしても,実学として学名を利用する立場からすれば,頻繁に学名を変更されるのは大変迷惑な話である。とは言っても分類なしには最新のDNA研究も発表できない。この意味で分類学は科学を支える根幹的な学問である。なんともやり切れない話である。

 このジレンマを解決する妙案は,実は,分類情報をデータベース化してWeb上に公開し,万人が利用できるようにすることにある。アリ類データベースは,このことにいち早く気づいた遺伝学研究者が素材を持つ分類研究者とコンピュータ操作の得意な生物情報学研究者の仲立ちになって,手弁当で夢を実現させたのである。しかし,少なくとも最近までの分類研究者は分類データベースに否定的であった。金もない物もない人もいない,加えてデータベースは研究業績にならないと言うのが原因のようである。しかし最近データベースが研究業績として認められる機運が生じ,GBIF絡みでデータベースにお金が付くとわかって,にわかにデータベースブームに火がつきそうになった。その矢先,予算削減で夢ははかなくもしぼんでしまった。なんともお粗末な話である。

アマチュアグループによるアリ類画像データベース登場

 暗い話が続いた。またしても日本は乗り遅れたかという声が聞こえそうであるが,実は日本にはかつて学問としての自然史科学が根づいたことはなかったのである。明治以来日本の博物館は,社会教育目的の展示場で学問としての分類学の拠点ではなかった!また日本に大学博物館が設置されたのはつい最近のことである!従来の日本の分類学(特に昆虫分類)を担ってきたのは,実は,個人の篤志家つまりアマチュアであった。アリもまた例外ではなかった。

 アリは,身の回りでよく見かける昆虫でしかも仲間と助け合って高度な社会生活をするためか,昔から蟻(義の虫)と呼ばれ一目おかれてきた。現在日本には273種のアリが知られているが,10数年前までは極く普通に見られる種でもその学名ははっきりしていなかった。というのは大半(200種以上)のタイプ標本が欧米の自然史博物館に収蔵されており,加えて日本にはアリの文献が皆無だったからである。この窮状を救ったのは,私財を投げ出しアリの文献と標本を収集した一人の在野のアリ研究家であった。そのような経緯を経て,1965年にアリの同好会(日本蟻類研究会)が結成され,1988-1994年に同研究会の有志が日本産アリ類の分類学的な整理をおこなった。これにカラー画像を加えて日本産アリ類図鑑を刊行しようとしたが,カラー印刷が高価なため実現できなかった。丁度そのときインターネットが実用化され,生物情報学のメンバーの協力を得て「日本産アリ類カラー画像データベース」としてWeb上に公開したのが1995年1月であった。そんな経緯でできたアリのデータベースが,公開以来高い人気を保ち続けているのはどうしてであろうか?次にアリ類画像データベースの特色を述べて,その理由の一端を考察してみたい。

アリ類画像データベースの特色
1. 画像を中心としたデータベース

 最近色々な生物関連のデータベースがWe上に公開されるようになった。その多くは個人またはグループが自発的に構築しているもので,公的機関の公式なデータベースとして公開されているものはいたって少ない。中身は高度に学術的なものから個人的趣味まで玉石混交といった状況にあるが,人気の高いサイトに共通する特徴はデジタル画像を売りにしている点にある。

 従来の分類学のテキストは,ラテン語で書かれた学名と2分岐検索および種の記載がセットになっているが,難しい学術用語を用いた文字情報が氾濫しているため,分類の専門家以外は難解で退屈な代物であった。現にGBIFが展開しようとしているデータベースは,学名と標本ラベルを中心とした文字情報データベースで,もっぱら分類研究者の便宜を優先させているといっても過言ではない。この難解さこそが,分類学を一般社会から乖離させ衰退に追いやっている原因の一つではないだろうか。

 これに対してアリ類データベースでは,文字情報に線画やカラー画像を加えて,出きるかぎり視覚に訴えるように工夫している。画像情報は専門的知識なしに誰でも理解することができる利点がある。そもそも分類の記載が文字に頼ったのは,印刷技術と経費上の制約で画像が利用できなかったからである。デジタル画像技術が格段に進歩した昨今,画像のないデータベースを構築しても,21世紀に分類学を蘇らせる起爆剤にはなりえないであろう。

アリ類画像データベースの特色
2. 社会の役に立つ分類データベース

 分類データベースは,生物の名前の戸籍簿として,学問に裏打ちされた分類体系に従っていなければならない。しかし一方では,誰でも使える社会に開かれたデータベースであるべきだと思う。この点アリ類データベースは学術と教育普及という2つの顔を持っている。学術用には,分類学的テキストの他に高品質の標本デジタルカラー画像を用いている。一方教育普及用には,プロの写真家による生態写真を基に小学生向けに書かれた印刷本をデジタル化してアリ学入門として収録している。これら2つのメニューは,高品質のカラー画像を仲立ちにして,ユーザーのニーズに合わせた複数の検索システムを導入することによって緊密に結びつけられている。このため,学術・教育両用データベースとして,小学生からプロの分類研究者まで幅広いユーザーの利用が可能になっている。


図3 アリ学入門の1つ,学研の写真図鑑アリ

URL, http://ant.edb.miyakyo-u.ac.jp/
INTRODUCTION/Gakken79/title.html

 教育普及を視野に入れることで,ユーザーとの双方向の情報交換が必要になる。アリ類データベースでは,できるだけユーザーの質問に答えるようにし,その結果をアリQ & Aコーナーとして公開することにした。つまり積極的に社会サービスを行い大勢のユーザーの支持を得ることによってアリ類データベースの社会的価値が高まり,そのことが長い目で見てアリ類分類学を発展させる礎になるのではないかと期待しているのである。

アリ類画像データベースの特色
3. データベースの鍵を握る検索システム

(3-1)中身の見える検索方式

 現在出回っている多くの分類データベースの検索は,検索用の四角い空欄にキイワードを入力すると,それに見合った情報が出力されるようになっている。この方式は,インターネットのサーチエンジンとして実用化されている,googleやyahooなどと同じ全文検索方式である。素材を用意し検索ソフトを稼働させるだけなので作り手にとっては簡便ではあるが,中身が見えないため分類の素人には適切なキイワード(正確な学名や和名など)が入力できず利用が難しい。この困難は,日常語で表した見出し一覧など中身をユーザーに見せることによって,格段に使い勝手がよくなる。

 日本産アリ類では273種しかないので,見出し項目に和名と学名のボタンを用意し,クリックすれば和名は五十音順で,また学名はabc順で全種一覧が見えるようになっている。種数が多い場合は,まず属か科単位の一覧を示してクリックするとそれに含まれる種の一覧が見える2段階方式が望ましい。例えば植物の場合,まずサクラやスミレのような日常語の一覧を用意し,名前をクリックするとそれに含まれる種名一覧が見えるように工夫することによって,正確な和名を知らないユーザーも中身を見る(検索する)ことができるようになる。データベースは使ってもらってなんぼの世界である。一般ユーザーは少しでもつまずくと見てくれない。「そんなユーザーは相手にしない」というのではなく,「そんなユーザーもつい覗いてしまう」ような工夫が必要である。そのためにはクリックすれば中身が見えるようにすればよい。この「クリック& オープン方式」こそデータベース検索の基本と考えている。


図4「日本のアリ」和名一覧

URL, http://ant.edb.miyakyo-u.ac.jp/Index/index.html

 (3-2)アリで試みた各種検索方式

  「クリック& オープン方式」を効果的にするためには,データベースの元になる素データ(例えば種名,属名,科名,画像,分布,記載等のファイル)を互いにリンクさせ,必要な項目をクリックすればその項目に飛ぶようにすることで,より深みのあるデータベースを構築することができる。アリ類データベースでは,クリックして最終的に行き着くのは「電子アリ図鑑」である。この図鑑には,和名・学名・シノニム・種の記載・文献・分布・県別分布図・3方向(背面・側面・正面)画像をセットにして,種毎の分類情報が網羅されている。そしてどの入り口から検索しても,3回以内のクリックで電子アリ図鑑に行き着くように工夫してある。


図5a 電子アリ図鑑の基本画面

URL, http://ant.edb.miyakyo-u.ac.jp/Taxo_J/F80903.html
和名,学名,分類位置,3方向(背面・側面・正面)の画像(スケール付),原記載,シノニム,解説,分布,解説担当者名,学習図鑑関連ページのデータがある。また,「表示項目を選ぶ...」から「生息分布図」「画像一覧」へリンクしている。

図5b 拡大図

URL, http://ant.edb.miyakyo-u.ac.jp/PCD0232/HTML/08.html

図5c さらなる拡大図

URL, http://ant.edb.miyakyo-u.ac.jp/PCD0232/C/08.jpg

図5d 生息分布図

URL, http://ant.edb.miyakyo-u.ac.jp/Map_J/F80903.html
日本蟻類研究会のメンバーが調査した各種ごとの分布データをもとに作成した県単位の分布図。

図5e 画像一覧

URL, http://ant.edb.miyakyo-u.ac.jp/Photo_J/F80903.html
基本画面だけでなくデータベース内にあるこの種に関連したすべての画像を見ることができる。

 しかし手作業による単純なリンク方式は,データ数が数百程度の少ない場合には効果的であるが,データ数が数千から数万になると破綻をきたす。実際95年版アリ類データベースはこのリンク方式で作成して成功をおさめたが,リンクを張るのが手作業のため,98年の英訳改訂版の際に数万件におよぶリンク網を張り替えることができなくなって破綻に追い込まれた経緯がある。

 手作業リンク方式に替わって98年版に採用されたのは,Fコードをベースにしたリレーショナル方式であった。この方式は,アリの種をF10101など5桁の認識番号で整理し,ファイルメーカーなどのカード型データベースソフトを使って全ての素データファイルをこの番号を通じて管理する方式で,自動的に電子アリ図鑑を作成したり,種属科などの分類学的階層間を自在に素早く行き来出きる点で大変優れた方式である。しかし,Fコード・リレーショナル方式にも弱点がある。それは分類データベースでは頻繁な種名変更に伴って常にデータの改訂が必要になるが,データの管理システムが複雑で高度な職人技が要求されるため,分類研究者が自分たちでデータ管理できないことである。

 分類データベースは,最終的には分類研究者自身の手でデータの更新ができる方式が望ましい。このことを念頭において今回2003年改訂版では2つの新しい試みを行っている。一つは,オーストラリア産アリ類画像データベースでの試みで,分類研究者が作成した従来のチェックリストをMicrosoft Wordのまま読み込み,文字列のパターンや並びの規則性から各種の分類情報を切り出してデータベース化し整列表示する方式である。閲覧したい情報(種・属・亜科・シノニム・画像)の項目ボタンを用意し,クリックすると該当する項目の内容が見えるようになっている。この方式のメリットは,電子化されたチェックリストを分類研究者がいつでも自由に改訂できる点にある。どんなに内容が変わっても,その都度パターン切り出し方式で必要な情報を抽出して表示するので,Fコード・リレーショナル方式のようなデータ改編に伴うシステムの破綻が生じない。

 もう一つは,アリ類データベースの長年の夢であったファジーマトリックス検索である。まずファイルメーカーを用いて学名・和名・分布・形態的特徴・習性など分類検索に必要な情報を網羅した項目一覧表を作成し,種毎にyes/no, +/-,または数値を記入した一覧表(マトリックス)を作成する。次に各項目を簡略化したキーワードの一覧を別途用意してマトリックスとリンクさせる。検索は,キーワード一覧の中から適当な項目を選びデータ(例えば,体長:6 mm,胸の色:赤,生息場所:高山,習性1:塚をつくる,習性2:蟻酸を出す,等々)を入力して検索ボタンを押すと,その条件を満たすアリの候補がヒット確率の高い順にエゾアカヤマアリ,ツノアカヤマアリ....のように表示される仕組みである。従来の分類検索は,形態的な特徴のみが用いられてきたが,マトリックス検索では,その他に生態学的(分布・習性)や遺伝学的(染色体)な情報も網羅しているので,アリの分類をまったく知らないユーザーが専門的な知識なしに色々な側面から検索することが可能になる。分類データベースとして将来の発展が期待される方式である。

 このほかに文字の代わりに画像を用いたイメージ検索も捨てがたい魅力がある。これは,アリの背面図の見出し画像一覧を用意し,検索しようとしているアリに似た画像を選んでクリックするとそのアリの電子アリ図鑑に飛ぶようになっている。例えば,検索画面に日本地図を北海道・東北・関東など地域別に色分けして表示しておき,それぞれの地域に生息するアリの見出し画像を「最普通種」「普通種」「稀な種」など頻度順に並べておくことで,イメージ検索を効果的に使うことができる。また体の顕著な特徴,例えば刺がある・腹部末端に針を持つ・腹部が鉤状に曲がっている,などを線画やカラー画像を用いて示すことにより,文字だけでは明確に判断できない形質をより正確にユーザーに伝えることができる。


図6a イメージ検索/形態優先表示

URL, http://ant.edb.miyakyo-u.ac.jp/Find_J/IMG_frq.html

図6b イメージ検索/サイズ優先表示

URL, http://ant.edb.miyakyo-u.ac.jp/Find_J/IMG_frq.html

 以上検索方式には様々な可能性があることがお分かりいただけたと思う。それぞれ長所と短所があるので,その特徴を熟知して複数の検索方式を組みあわせて使うことで,同じデータベースを用いて幅広いユーザーがそれぞれのニーズに合わせて学術用にも教育普及用にも利用できるようになる。データベースの出来不出来は,データの中身もさることながら,検索の善し悪しが決め手といっても過言ではない。アリ類データベースが公開以来長期にわたって人気がある秘密は,高品質画像に加えて多彩な検索方式を駆使している点にあると思う。とにかくクリックすれば何か出てくる。次に何が出てくるか?という期待感につられて,ゲーム感覚であちこち見て歩くうちに知らずしらずにアリの知識が身に付いてゆくのである。

 しかし忘れてはならないことは,ユーザーの便宜を図ることも大切であるが,それ以上に大事なことは,データベースの作り手(今の場合分類研究者)がデータの管理を自分で行えるようなシステムにすることである。アリ類データベースでは,試行錯誤の末今ようやくそんな理想的なデータベースを手中にしたところである。

アリ類画像データベースの特色
4. 世界に通用する分類データベース

アリ類データベースは,画像を中心としているために海外のユーザーも利用できる。しかし,より詳しい内容を理解するためにはどうしてもテキストが必要になる。この点本データベースはカード型のソフトであるファイルメーカーを使用して,日本語と英語の二カ国語でデータベースを作成しているので,英語圏の一般ユーザーも広く利用が可能になっている。

 英語化に際しては,アリ類データベース作成グループ(JADG)のメンバーにオーストラリアのアリ類分類研究者(R. W. Taylor)がいたことが非常に心強かった。日本人にとって英語はどうしてもネックになるからである。しかしまた逆に,日本のアリ類データベースのノウハウを生かして,オーストラリア産アリ類画像データベースもできたことを考えると,これからのデータベース構築には国際的な協力関係がいかに大切であるかを示唆していると思う。アリ類データベースはそのモデルケースといえよう。

 世界に通用するデータベースになるためには英語版データベースは必須であるが,欲を言えば,英語だけでは非英語圏の一般ユーザーの利用は難しい。そこで将来的には英語版を国際標準とし,日本語版を各国語に翻訳して置き換えることによって,英語-各国語の二カ国語データベースを作成することが望ましいと思っている。技術的にはアリ類データベースはそれが可能なシステムを内蔵していることを付け加えておく。

アリ類画像データベースの特色
5. 分類画像データベースと印刷出版

 分類学の分野では,データベースは長い間研究業績として認められなかった。そのような寒風の中でアリ類データベースは,データベースの手本もないまま試行錯誤を繰り返しつつ,常に時代のフロンティアとして活動を続けてきた。幸いにも文部省科学研究費補助金(研究成果公開促進費,データベース:平成1-3,5-10年度),総合研究大学院大学共同研究費(平成9-14年度)および科学技術振興事業団生物多様性情報データベース(平成13-14年度)等の研究助成を受けることができ,その成果は,アリ類画像データベース2003年改訂版として近々完成の予定である。アリ類のデータベースとしては,質量ともに決して欧米に引けを取らない内容であると自負している。

 我々の努力が天に通じたのか,最近ようやくデータベースが研究業績としても評価されるようになり,ついに総合研究大学院大学の出版助成と学研の協力を得て,データベースの成果を"Ants of Japan"および「日本産アリ類図鑑」として英文と和文の二冊の印刷本として後世に残す機会に恵まれることになった。望外の喜びである。高品質画像が決め手であった。Web上のデジタルデータベースはユーザーのニーズに合わせた多面的検索ができる点で優れているが,伝統的な印刷本はアナログ情報に慣れ親しんだ世代として感無量の重みがある!とまれ,英文印刷本にはアリ類画像データベース2003年改訂版のCD-ROMを付録につけて,デジタルとアナログを共存させるつもりである。

 最後にこのようなユニークなデータベースを構築したアリ類データベース作成グループのメンバーの名前をあげて,本講演の締めくくりとしたい。

今井弘民,木原章,近藤正樹,久保田政雄,栗林慧,緒方一夫,小野山敬一,R. W. Taylor,寺山守,月井雄二,鵜川義弘,吉村正志 (abc順)