原生生物データベースの利用実績と外部評価: 外部評価
検索エンジンによる評価

GoogleのPageRank調査結果:その1  その2はこちら

 検索エンジン,Google(http://www.google.com/)では, PageRank と呼ばれる独自の手法で検索結果に「情報の重み付け」を行なっています。PageRankとは,検索された各WebPageが他のWebPageからどれほどリンクされているか(=重要視されているか)で検索されたWebPageのランク付けを行なうものです。
 このため,重要度の高いWebPageからのリンクが多ければ多いほど,そのWebPageの評価も上がり,検索結果の一覧表示の上位に位置付けられるようになります。学術サイトの場合であれば,世界中の主要な学術情報サイトからのリンクが多ければ,その分ランクの上位に位置する可能性が高くなるわけです。いいかえると,Googleの検索により上位にランクされれば,それなりに学術サイトとして評価されているとみなすことができます。
 下表は,2001年10月22日〜2005年12月22日までのGoogleでの原生生物情報サーバにある各pageのランクです。2005年12月22日は2列ありますが,(ja)は日本語モードでの検索結果,(en)は英語モードでの検索結果を示しています()。
 また,各生物名(学名)の部分をクリックすると現在のGoogleにおけるPageRankの結果が表示されます。

  2001.10.22 2002.10.14 2003.11.24 2004.04.01 2004.11.26 2005.04.17 2005.12.22(ja) 2005.12.22(en) 2007.03.24
検索キーワード ヒット数 ヒット数 ヒット数 ヒット数 ヒット数 ヒット数 ヒット数 ヒット数 ヒット数
Mastigophora
Codosiga 149 2 134 1 251 1 516 1 596 1 211 1 513 1 513 1 910 1
Mastigamoeba 224 2 339 1 730 1 844 1 1,480 1 1,180 1 9,110 2 9,120 2 30,900 1
Cryptomonas 1,160 2 1,640 1 3,460 1 4,360 1 11,200 1 9,660 3 33,900 2 33,900 1 88,100 3
Chilomonas 529 1 517 1 1,180 1 1,580 1 3,680 1 1,370 1 13,700 1 13,700 1 23,300 1
Euglena 10,800 3 14,700 1 30,900 5 40,300 5 85,200 4 96,400 5 254,000 8 254,000 6 570,000 1
__ E. gracilis 2,340 11 3,240 5 7,650 1 8,510 1 24,300 2 27,100 2 96,400 2 96,400 2 272,000 1
__ E. deses 142 1 164 1 494 1 428 1 436 1 215 1 523 1 522 1 1,240 1
__ E. spirogyra 899 3 1,100 2 1,903 1 2,260 1 4,410 1 4,140 1 16,700 1 16,700 1 33,500 1
Phacus 819 2 897 1 2,040 1 2,820 1 5,630 1 3,670 1 20,700 1 20,700 1 32,100 1
Peranema 508 5 610 1 1,140 1 1,690 1 3,320 1 904 1 10,400 2 10,400 2 16,400 1
__ P. trichophorum 110 2 144 1 325 1 232 1 294 1 224 1 347 1 348 1 644 2
Entosiphon 517 2 482 1 1,120 1 809 1 838 1 1,050 1 838 1 837 1 16,600 1
Sarcodia
Actinophrys 361 4 564 1 826 1 847 1 784 1 1,550 1 972 1 972 2 17,200 2
Ciliophrys 62 1 88 1 178 1 410 1 568 1 242 1 2,360 1 2,360 1 843 1
Amoeba 80,800 28 109,000 63 256,000 37 298,000 19 600,000 44 666,000 27 1,730,000 25 1,720,000 21 3,050,000 13
__ A. proteus 1,520 1 1,990 1 4,260 1 4,230 1 10,100 1 20,300 1 64,600 3 64,600 5 101,000 1
Mayorella 603 2 288 3 909 1 805 1 1,090 1 678 2 637 3 636 2 842 1
__ M. penardi 43 1 59 1 136 1 88 1 118 1 83 1 293 3 290 2 165 1
Cochliopodium 191 1 142 1 331 1 576 1 556 1 224 1 562 1 561 1 1,190 1
Arcella 4,690 8 10,300 3 24,700 2 29,200 3 51,800 3 61,300 6 168,000 1 168,000 1 419,000 1
__ A. vulgaris 209 2 284 1 563 1 506 1 597 1 548 1 810 1 811 1 9,960 1
__ A. gibbosa 71 1 82 1 179 1 183 1 176 1 121 1 191 1 192 1 354 1
Difflugia 749 1 829 1 2,620 1 2,070 1 4,290 2 837 1 18,800 1 18,800 1 44,500 1
Vampyrella 314 1 638 1 618 1 743 2 2,470 3 2,740 2 13,000 3 13,100 3 80,300 1
Euglypha 491 1 437 1 1,120 1 896 1 1,110 1 816 1 904 1 904 1 15,200 1
Biomyxa 108 1 91 1 490 1 193 1 304 1 214 1 536 1 536 1 804 1
Ciliophora
Stentor 23,900 6 54,600 6 100,000 9 130,000 7 632,000 6 694,000 12 5,290,000 15 5,480,000 8 3,230,000 4
Blepharisma 6,310 2 1,620 2 23,600 1 17,300 2 52,400 2 77,700 2 229,000 2 229,000 2 729,000 3
Uroleptus 149 2 128 1 340 3 314 1 441 1 364 1 536 3 536 1 814 3
Oxytricha 971 4 1,320 1 3,390 1 3,690 37 8,260 9 127,000 1 236,000 2 236,000 1 92,800 1
Euplotes 2,030 5 2,590 2 6,280 1 7,310 1 16,100 1 17,500 1 71,300 1 71,300 1 138,000 1
Coleps 423 4 544 1 1,040 1 994 1 3,180 2 937 5 10,600 4 10,600 5 17,600 1
Loxophyllum 320 3 300 1 573 1 612 1 658 1 350 1 524 1 522 1 553 1
Nassula 365 1 290 1 644 1 612 3 1,940 3 5,640 1 614 1 613 1 12,100 1
Paramecium 15,600 3 28,500 5 51,000 6 56,500 4 127,000 5 267,000 4 586,000 5 581,000 7 761,000 3
__ P. caudatum 1,590 1 1,970 1 4,340 1 4,720 1 10,200 1 11,100 1 40,000 1 39,900 1 95,800 1
__ P. aurelia 747 4 1,090 1 2,070 1 2,120 1 6,170 1 4,530 2 28,400 1 28,400 1 72,300 1
__ P. bursaria 1,590 3 2,390 3 3,480 1 3,390 1 5,710 1 5,010 1 25,400 1 25,400 1 65,200 1
Tetrahymena 7,550 46 9,700 8 27,400 7 32,000 5 102,000 7 88,200 8 345,000 5 344,000 10 855,000 1
__ T. thermophila 1,930 29 2,760 9 7,850 19 9,690 16 23,500 3 144,000 1 111,000 1 110,000 8 316,000 1
Heterokonta
Ochromonas 792 7 970 8 1,910 1 2,150 1 5,730 2 4,230 4 22,900 2 22,900 1 70,100 2
Dendromonas 48 1 59 1 98 1 227 2 213 1 79 1 1,910 1 1,910 1 294 1
Vaucheria 870 9 1,260 8 2,150 1 2,360 2 5,500 1 5,150 2 22,500 4 22,500 4 65,200 1
Pinnuralia 44 1 46 1 37 1 43 1 41 1 18 1 84 1 85 1 53 1
Pinnularia - - - - - - - - 8,890 3 7,390 1 37,500 1 37,500 2 60,500 1
Cymbella 1,140 1 3,690 1 4,250 3 4,600 3 10,400 4 9,440 1 41,100 3 41,100 2 68,100 4
Navicula 5,400 19 11,600 12 15,800 9 16,100 6 36,300 6 43,400 6 132,000 8 132,000 10 265,000 1
Chlorophyta
Chlamydomonas 15,400 68 20,800 15 55,900 9 119,000 11 300,000 7 155,000 6 744,000 4 736,000 12 1,360,000 10
Pandorina 1,300 6 1,960 1 3,100 1 4,270 1 9,920 1 9,940 1 37,800 1 37,800 1 113,000 1
__ P. morum 252 1 278 1 549 2 428 1 668 2 513 1 601 1 601 1 16,100 1
Volvox 10,200 3 16,100 4 49,000 5 47,700 3 136,000 5 244,000 6 388,000 27 388,000 5 806,000 9
__ V. globactor 15 1 20 1 30 1 32 1 97 1 107 1 358 1 357 1 208 1
Pediastrum 1,650 16 1,770 1 2,640 1 4,600 1 9,770 2 9,850 1 31,600 1 31,600 3 76,600 3
Scenedesmus 5,840 1 9,300 1 2,040 1 24,600 1 37,300 1 46,200 1 135,000 2 135,000 1 437,000 2
Coelastrum 620 1 608 1 1,450 1 1,720 1 4,340 1 665 1 12,600 1 12,600 1 30,800 1
Monoraphidium 522 1 822 1 2,660 1 2,560 2 5,730 3 832 1 18,300 2 18,300 1 37,500 3
Closterium 2160 4 3,240 1 4,010 1 8,890 1 14,700 1 15,500 1 50,200 1 50,200 1 119,000 4
__ C. acerosum 106 2 144 1 349 1 257 1 315 1 281 1 439 1 439 1 833 1
Zygnema 573 3 797 1 1,490 2 1,780 1 3,990 1 7,640 1 17,600 1 17,600 1 53,600 2
Spirogyra 4,730 5 5,920 6 10,900 4 11,800 5 27,000 5 40,100 4 126,000 5 126,000 6 244,000 3
Staurastrum 1,090 13 1,050 1 2,530 1 3,060 2 7,220 1 4,320 1 23,800 1 23,800 1 54,700 1
__ S. dispar 36 8 48 1 106 1 67 2 84 1 104 1 379 1 384 1 401 1
Cosmarium 1,430 11 1,310 1 3,160 1 4,180 1 9,100 3 7,800 1 35,100 1 35,100 1 58,000 1
__ C. javanicum 16 1 33 1 48 1 31 1 56 1 60 1 164 1 165 3 158 1
 合 計  226,118 385 338,386 209 740,337 170 932,803 183 2,438,270 176 2,957,727 153 11,313,105 184 11,478,114 173 15,150,366 121
2007年03月25日現在

TetrahymenaやChlamydomonasなどゲノム研究に使われている生物種は関連のWebPageが多いため本データベースのランクは下がりますが,他の多くの原生生物では,検索結果のかなり上位に位置していることがわかります。
 Amoebaの場合は,コンピュータ分野でAmoebaという名称のソフトウェアがあり,これを扱ったWebPageが数多くあるためランクが下がっています。しかし,属&種名(Amoeba proteus)で検索すればランクは一気に最上位(1/1,520)に上昇しました。(2001年10月22日現在)

約半年ぶりに再チェックをしたところ,全体としてヒット数が増加(298,256/226,125=1.31倍)しているが,その中にあってランクはほぼ一様に上昇していた(ランク合計;386 → 291)。(2002年03月30日現在)

最初の調査から約一年後になる2002年10月14日の夜に再びチェックを行ったところ,ヒット数はさらに増加し(298,256→338,392),ランクも上昇していた(291→210)。
 また,細部をみると,以下のような点に気付いた。まず,前回調査した今年の3月頃のGoogleが収拾したWeb pageの数はおよそ20億7000万ページだったが,それが今回は24億7000万ページ弱に増えていた。すなわち,全体としては約1.19倍に増加したことになる。これに対して,調査項目全体のヒット数は約1.13倍の増加で,全体の増加率を下回った。これは,社会(世界)の原生生物に対する関心が総じてやや減る傾向にあること示しているのではないだろうか?
 項目ごとにみると,1)ヒット数の多いものは全体の増加率とほぼ同じか,一部はそれを上回るものもあった(Paramecium 1.48)。2)一方,もともと数の少ないものは前回の増加率を下回るものが多くみられた。すなわち,前回と同じ程度か,なかには前回から数を減らしたものもあった。
 原生生物への関心がやや減る傾向に中にあっても,人々の興味が多く集まるものは,そのことがさらなる刺激源となって更に興味を増大する傾向にある。逆に世間的には馴染みのない,専門家しか興味を持たないような生物は,しだいに忘れ去られる傾向にあることを示していると推察される。

半年ぶりに4度目の調査を行った。その結果,ヒット数の総計は338,392から455,416へと増加していた。増加率は約1.3で,この値は2回(3/31)→3回(10/14)の増加率1.1よりは大きいが1回(10/22)→2回(3/31)の増加率(1.3)と同じだった。この理由は,Googleの場合,春から秋にかけてのデータ収集量よりも秋から春にかけての収集量が多いためか,あるいは,世界のWeb情報の増加率が秋から春にかけての方が他よりも高いかのいずれかであろう。
一方,ランクの総計は前回の210から189へと上昇(値が小さい方が上位にくるものが多い)していた。
ちなみに,この日のGoogleのデータ総量は,3,083,324,652(30億8332万ページ)とのことで,前回の24億7000万ページ弱からは,約1.24倍の増加率であった。したがって,ヒット数の増加率(1.3)は,Googleのデータ総量の増加率(1.24)よりも若干多いことになる。すなわち原生生物関連の情報の増加率が全体平均の増加率を若干ではあるが上回ったことになる。これが原生生物の研究者ないしは原生生物に関心のある人々が増えてきていることを意味するのであれば大変喜ばしいかぎりである。 (2003年04月21日)

7ヶ月ぶりにランク調査を行なった。この日(11/24)のGoogleのデータ総量は,3,307,998,701(33億799万ページ)。前回の調査時(4/21)と比べると1.07倍,すなわちわずか7%の増加にとどまった。しかし,ヒット数の総計は740,344で,前回の455,416で割ると1.62で,62%も増加していた。上記の学名を含んだWebpagesが他に比べて著しく増えた訳だが,これは学術関連のWebpagesの伸びがなんらかの原因で加速されたことを意味しているのだろうか?
 その中にあって,当方のランクの総計は前回よりもさらに少なくなった。すなわち全体的にみて当方のWebpagesのランクが上昇していた。また,個々のWebpagesをみてもほとんどがランクを上げていた。
 ちなみに,既述した数の多いWebpagesの増加率は数の少ないWebpagesよりも高いという傾向は相変わらず続いている。たとえば,AmoebaのWebpagesは,前回の15万からいっきに10万ページも数が増えている(その中にあって当方のランクは57位から37位へ上昇した)が,前回34しかなかったVolvox globactorは,30に減っていた。 (2003年11月24日)

追記:上記のデータのうちヒット数は再考が必要のようである。調査から3日後の今日(11/27),再度検索したところ,多くのキーワードのヒット数が減少していた。たとえば,Amoebaだと11/24の時点では,256,000件だったのが,今日になると171,000に減っていた(ただし,7ヶ月前の152,000よりは増えているが,,)。これはGoogleではデータベースに新規に集めたwebpagesのデータを追加した後で,ネット上から消滅したwebpagesをデータベースから削除する作業を行なっているためと思われる。たまたま11/24では集めたばかりでデータを削除する前だったのであろう。今回のAmoebaのヒット数を前回と比較すると増加率は1.13(11/24の時点では1.68)となり,Google全体の増加率(1.07)に近い値となる。(2003年11月27日)

前回の調査から4ヶ月しか経っていないが,今回は少々早めにランク調査を行なった。その理由は,このわずか4ヶ月の間に,Googleの収集したWeb pages数が大幅に増加したからである(約10億ページ)。その増加率は1.30で過去最高であった。原生生物関連のWeb pagesの増加率もほぼ同じ(1.26)だった。一方,ランクの総計は,前回の170から183に増加していた。この主な理由は,繊毛虫 Oxytrichaのランクが前回の1位からいっきに37位へと転落したためである。このOxytricha効果を差し引くと,ランクの総計は,147となり,ランク総計の減少傾向(=ランクの上昇傾向)は変わっていない。Oxytrichaのランクが下がった原因は不明だが,検索結果をみると,当方のサーバと極めて近い位置に設置されている ameba.i.hosei.ac.jpのOxytrichaのWeb pageが1位に上昇していた。もしかすると,この影響かも知れない。
 この他,ヒット数の多い(=世間の関心の高い)Web pagesはますます増加し,数の少ないWeb pagesは減少する,という傾向は前回と変わらずに続いていた。 (2004年4月1日)
 なお,この調査は4月1日の午前3時に行なったが,その6時間後に再度チェックすると,ヒット数はすでに多少とも変化していた。したがって,上の表にあるヒット数は今現在とはある程度違いが生じていることをあらかじめご了解願いたい。

  2001.10.22 2002.10.14 2003.11.23 2004.04.01 2004.11.26 2005.04.17 2005.12.22
Googleが集めたWebpages総数 - 24億7000万 3,307,998,701 4,285,199,774 8,058,044,651 8,058,044,651 不明
前回からの増加率 - - 1.34 1.29 1.88 1.00 不明
ヒット総数 226,118 338,386 740,337 932,803 2,438,270 2,957,727 11,313,105
前回からの増加率 - 1.50 2.20 1.26 2.61 1.21 3.82
ランクの総計 385 209 170 183 176 153 184
ランクの総計/ヒット総数 0.0017 0.0006 0.0002 0.0002 0.0000 0.0000 0.0000
例年どおり,今回も約半年後に調査を行なったが,この半年間にGoogleが集めたWebpages総数は,これまででもっとも大きな増加率を示した(1.88)。およそ2倍弱の伸びであるが,それ以上に,原生生物関連キーワードでのヒット数が増加していた(2,438,270,2.61倍)。Webpageの数が急に2倍近くも増加するというのはこれまでにないことなので,もしかすると,これはGoogleの集計方式の変更など内部的な処理の問題も関係しているのかも知れない。
 いずれにせよ,当サイトのランクの総計はこれまでとさほど変わっていないため(176),結果としてヒット数で割った値はほとんどゼロに近くなってしまった。
 なお,上の表をご覧いただけばわかるが,増加が目覚ましいのは,もともとWebpage数の多いもの(AmoebaやTetrahymenaなど)であり,マイナーな学名のWebpage数はさほど増えず,中には減少したもの(Cochliopodium,Dendromonas,Actinophrysなど)さえあった。以前に指摘した「人気のあるものにはますます人気が集まり,人気のないものはますます忘れ去られていく」という傾向が依然として続いていることがわかる。 (2004年11月26日)
注:今回はこれまでハネケイソウの学名が間違っていた(正:Pinnularia,誤:Pinnuralia)ことに今頃になって気付いたため,古い誤表記を残したまま,新規に正しいPinnulariaによる検索結果も追加した。そのため,一行分だけデータ数が増加している。

2005年12月22日の検索結果が2つあるのは,最近,Googleの検索結果が,日本語モード(ja)と英語モード(en)で一部に違いがあることに気付いたので,それぞれのモードで検索して比較対照を試みたためである。
 その結果,大半のキーワードは日本語モード(ja)と英語モード(en)でほとんど差がなかったが,一部(Tetrahymena, Stentor, Chlamydomonas, Volvox)でランクに違いが認められた。研究材料としての知名度が高い(=研究者の世界では知られているが,一般には馴染みがない)ものでは若干ランクが下がったが(5→10,4→12),反対に,日本国内で一般に名前が知られているStentor, Volvoxでは,日本語モードでは他のサイトの日本語で書かれたWeb pagesが上位にランクされていたが,英語モードでは,それらが除外されるため,当方のWeb pagesのランクは上昇(15→8,27→5)した。
 なお,今回は,前回(2005.4.17)からわずか7ヶ月しか経過していないにもかかわらず,ヒット総数は,3.8倍にも増加していた。これは,この期間に世界中のWeb pagesがいっきに3.8倍に増加したとは考えにくいので,Google側に原因があると思われる。収集法が変り,これまで収集していなかったサイトからのデータが急増したか,あるいは,データの集計方式が変更された(もしくはその途中で消去されるべきデータが残っていたため一時的に増加した)かのいずれかであろう。 (2005年12月22日)