原生生物と日本産アリ類の広域画像データベース

1 日本産アリ類カラー画像データベース作成の経緯

1-3 データベース作成グループの活動記録

 画像データベース化計画が始まる以前,日本蟻類研究会では,研究者および一般向けに250余種の確認種を網羅した「日本産蟻類の検索と解説 I, II, III」(日本蟻類研究会 1989, 1991, 1992)を刊行していた。また,将来的にこれを図鑑化するために,採集したアリ標本の写真撮影を継続して行ってきた(この際,アリの体色は死ぬと変化してしまうため撮影には野外から採集した個体を麻酔して用いている)。その後,これらをデータベース化すればより有効であろうということで我々が協力することになり,このデータベース作成プロジェクトが生まれた(1993年1月)。

 本計画のメンバーは北海道から九州にかけて在住しているため全員が集まれるのは年に1,2回しかない。そのため,データベース構築に関する連絡・議論・データ交換のほとんどはメーリングリストを作成してネットワーク上で行なっている。

グループ活動開始以前の関連事項
 データベース作成グループが結成される以前に日本蟻類研究会のメンバーによって作成されたデータベース関連の資料は以下のとおりである。

1)日本蟻類研究会から出版された日本産アリ類の分類に関する4分冊

  1. 日本産アリ類和名一覧 (A list of the ants of Japan with common Japanese names) (1988)
  2. 日本産アリ類の検索と解説 (I) (A guide for the identification of Japanese ants-I) (1989)
  3. 日本産アリ類の検索と解説 (II) (A guide for the identification of Japanese ants-II) (1991)
  4. 日本産アリ類の検索と解説 (III) (A guide for the identification ofJapanese ants-III) (1992)

     なお,グループ活動開始以降,以下の2分冊が追加された。
  5. 日本産アリ類文献目録 (A list of references on Japanese ants) (1994)
  6. 日本産アリ類県別分布図 (Distribution maps of Japanese ants) (1994)

2)各種アリのスライド撮影
 「検索と解説」のシリーズを出版すると同時に,久保田,今井の両氏によって生きたアリの写真撮影が継続して行なわれた。従来の模式標本は長年月の間に破損したり,生きた状態とは異なる体色に変化してしまうなどの欠点がある。そこで,生きたアリの画像を標本の替りとすれば,体色の変化や破損する恐れはなくなる上,複製もできるので利用しやすくなると考えてのことである。まず,生きたアリを麻酔し,種の特徴が最大限写し取れるように足等の配置を整えた。さらに,色の再現性を考慮して照明等の撮影条件をその都度調整して撮影を行なった。写真は,背面,横面,正面の三画面を基本として撮影した。一部は女王,王,兵隊アリ等についても撮影を行なった。

図1-1 トゲアリのスミス標本と画像データ
左は英国の自然史博物館所蔵の日本産トゲアリの模式標本(スミスコレクション)。 右は野外採取されたトゲアリのカラー画像、触角や肢の形がわかるように配置を整えてから撮影している。
 

 データベース構築作業が始まる前までに,110種余についてのスライドがこのようにして作成されていた。写真撮影は,データベースが構築された後も継続しており,随時,データとして追加されている。ただし,まだ撮影されていない種の多くは,南方の島などに生息する希少種であるため,後に残された種ほど生きた個体の採取が難しく撮影は思うように進まなくなりつつある。そこで,当面は,すでにある採集標本を代用として写真撮影する作業が進められている。
 

グループの結成後からデータベース作成までの経緯
 データベース作成グループが結成された後は,以下のようにして作業が進められた。
 まず,既述した「日本産蟻類の検索と解説 I, II, III」および「日本産蟻類文献目録」の原稿がすでにテキストファイルとしてあったので,種の検索・解説などのテキストデータとしてはそれらを加工して利用することにした。

画像のディジタル化
 問題は画像(スライド写真)のディジタル化だった。当初は,スキャナなどでスライドを読み取る作業を試みたが,これらは手間がかかる上,画質・解像度等に問題があった。その後,色々検討した結果,グループ結成の1年前(1992)にコダック社が始めたフォトCDサービスを利用するのがもっとも画質を損ねず,かつ,容易であることがわかった。
 フォトCDは画質・解像度の点で問題がないばかりでなく,色の再現性も良い。なにより手間いらずであることが利点である。コストは一枚あたり100円程度だが,これは仮に1000枚のスライドをディジタル化する場合を考えると,10万円余の支出で済み,同程度の作業を自前で器材を揃えて行なう場合の費用と比べるとかなり割安といえる(フォトCDと同等な高解像度の画像を作成するためには,プロ仕様のスライドスキャナを購入しなければならない。その費用は100万円以上はするはずである)。作業を委託して行なう場合の人件費も含めて考えれば相当のコスト削減になろう。
 一枚のフォトCDディスクには標準で100枚までの写真が保存できる。実際には各写真ごとに1つの画像ファイルがあるだけだが,フォトCD専用のインターフェイスにより,ファインダー上は192 x 128, 384 x 256, 768 x 512, 1536 x 1024, 3027 x 2048ピクセル計5種のサイズの画像があるようにみえる。実際に各々をHDDなどにコピーすることも可能である。

図1-2 フォトCDの制作過程
 手持ちのスライドやネガを写真店に持込みフォトCD制作を依頼する。その際,1枚のフォトCDには約100枚のスライドの画像がディジタル化して収納される。
 通常,依頼してから一週間程度でできあがる。「写真」というフォルダを開くと左図のように,計5つの異なったサイズの画像ファイルを収めたサブフォルダがある。
 データベース化する際には,これらをJPEG圧縮してファイルサイズを小さくしてから利用した。

 データベース作成当初は,4枚フォトCDが製作されたが,そこに収められた画像データは4 x 100 x 5 = 2000枚ほどあり,そのファイルサイズは合計2.8Gバイトに達した。そこで通常のパソコンではメモリ等の関係で事実上表示が不可能な最大サイズの画像ファイル(3027 x 2048)を省き,残りの4種の画像をJPEG形式で圧縮した。また,画像のサムネイル表示用として最小画像(192 x 128ピクセル)をさらに1/4(1/2 x 1/2)に縮小したファイルも作成した。このため,各画像について,サイズの異なるファイルが5種用意されたことになる。以後の作業過程でも同様の処理がなされた。
 これらを後述するハイパーテキスト(WWWブラウザ表示用のhtmlファイル)と共に1枚のCD-ROMに収めた。CD-ROMの作成にはRCD-202(Pinnacle Micro)を用いた。最初に製作したCD-ROM(CD-R)はMacintosh専用だったが,後に製作した一般配布用のCD-ROMは,Macintoshだけでなく WINDOWS95, UNIX上でも使用できるハイブリッドCD-ROMとした。
 作成した画像データベースは,当初,CD-ROMで配布するつもりだったが,計画が具体化する過程で,データベースの内容は研究の進展とともに追加・更新されるべきであり,将来を考えればネットワークを通じて公開するほうがより望ましいとの認識が生まれた。そのため,データベース化はCD-ROMの配布とネットワーク公開の二本立てでいくことになった。

データベースソフトの選定
 つぎの問題はソフト環境だった。当初は,これらの膨大な量の画像データを管理する適当なソフトがなかったため作業はなかなか進まなかった。画像専用の市販データベースソフトはあるが,一般への普及を考えると高価な市販ソフトを利用するのは好ましくないと判断した。

 最初は比較的安価なソフトであるハイパーカードやファイルメーカープロ(Claris)を利用してデータベース化作業を行なった。ハイパーカードはプログラムを自分で組まなければならないが,それだけ使い勝手のよいソフトを構築できる可能性があった。ファイルメーカープロは画像も扱える定番のデータベースソフトとして一般に普及しているのが採用した理由だった(データをみるだけなら無料の体験版ソフトも利用可能である)。

図1-3  WWW版以前に制作したデータベース
 WWWが利用できる前には,ハイパーカード(左)やファイルメーカープロ(右)を使って画像データベースを制作した。しかし,いずれも様々な機能的制約,及び,普及を考える上での問題があった(本文参照)。

 しかし,ハイパーカードはカラー画像の表示機能に問題があったし,ファイルメーカープロは扱えるファイルサイズに制限があり,大量の画像を扱うのには適していないなど,様々な機能的制約があった。
 さらにいえば,安価とはいえ,いずれのソフトも市販品である以上,利用者はそれらのソフトを購入しなければならない。さらに,Macintoshという特定の機種のみで稼働するので他のコンピュータでは利用できないなどの問題も指摘された(ファイルメーカーは現在は他機種用のものがありデータの互換性が保たれている)。

 データベースを作成する以上は,より多くの人に利用してもらいたい,という願いがあった。そのためには,できれば市販の有料ソフトを利用せず,また,機種の違いに関係なく利用できるものが望ましかった。そこで提案されたのがネットワーク(インターネット)の利用である。インターネットは機種の違いによらず接続することができ,そこで使用されるソフトの多くは利用者自らが作ったPDS(Public Domain Software)であったからである。しかし,グループ結成当初(1993)に利用できるインターネットの機能は,telnet, ftp, gopher程度で基本的にテキストベースの交信とファイルの送受信ができるのみであった(鵜川 1994)。

 しかし,その後,WWW(World Wide Web)という新しいネットワーク環境が生まれ普及するようになった(参照,表1-2)。最初(1993.1)に公開されたWWW用ブラウザソフト(Mosaic等)はUNIXワークステーションなど限られたコンピュータでしか稼働しなかった。そのため,すぐには利用できなかったが,1994年中頃には,日本語もなんとか表示できるMacintosh上で動くWWW用ブラウザソフトが入手できるようになった。それらのブラウザソフトを調べたところ,非常に簡単にたくさんのファイル(含画像)を管理できる上,その利用範囲はとくにネットワークに限定されないことがわかった。したがって,これを利用すれば膨大な画像データを管理するデータベースをネットワーク上で構築できるだけでなく,それをそのままCD-ROMとしても公開できることに気づいた。そこで,さっそくこれらを使ってデータベース(実際には画像を含んだハイパーテキスト)を作ることにした(1994.8)。
(実際に使用したブラウザソフトは MacWebというものである)

ネットワーク公開
 前述したように,1993年にデータベース作成グループが結成された当初はWWWはまだ利用できなかった。そのため,ネットワークで公開するとしても,作成したデータベースはanonymous ftp, gopher等により画像やテキストファイルを個々別々にネットワーク公開することしか考えられなかった。しかし,同時的に進行したインターネットの進化によって,最終的にはWWWサーバ上でハイパーテキストからなる画像データベースとして公開することになった。
 データベース構築作業はMacintosh上で行なったため(1994.8),当初のサーバ用ソフトにはMacHTTP(Copyright (c) 1991-1994, Chuck Shotton)を使用した。

 問題は公開サーバの設置場所だった。構築作業用のサーバ(Macintosh LC630)を設置したのは法政大学だったが,当時はネットワークの回線速度が遅かった。このため,法政大に公開サーバを設置した場合,外部からのアクセスに時間がかかるだけでなく,周囲のネットワーク環境にも迷惑をかける恐れがあった。そこで,画像データベースのミラーサイトを農業生物資源研究所にあるUNIXワークステーション上に設置した(http://www.dna.affrc.go.jp/htdocs/Ant.WWW/htmls/index.html)。このミラーサイトはアクセス条件がよいのでここを一般公開することにした。
 また,その後,1995年以降になって利用者が急激に増えてきたため,その他にもミラーサイトを増やしていった(1997年3月現在,7台)。

 この他,画像については,スケールの追加(木原 1996),色補正処理(木原 1996;参照10章),分布図の更新(木原&寺山 1996)等の作業が行なわれ現在に至っている。
 また,既述したようにデータベース以外にも様々な関連文書をWebPage化して公開している(後述)。