Pagerankの計算方法
Pagerankの仕組み
1998年発表の論文に基づいて、Pagerankの計算方法を解説しています。
Pagerankとは
PageRankとは、ページを閲覧している人の期待値を表し、各ページに与えられます。大きければ大きいほど、たくさんの訪問者がいると判断されたページである、というわけです。
Pagerankという名前は、グーグルの創始者の一人、ラリーペイジ(Larry Page)に由来するようです。
Pagerankの計算方法
Pagerankは、ページの訪問者数の期待値(の対数)として与えられます。
訪問者は、ランダムなページから出発し、一定時間後に移動するものとします。 移動するときは、そのページからリンクされているページのいずれか1つへ移動する(85%)か、全ページのどれかのページにランダムに移動する(15%)かします。 なお、この85%、15%という数値は1998年の論文の数値なので、今では異なるかもしれません。 (現在では87%、13%としているようです)
そうすると、被リンクの多いページには多くの訪問者が集まります。 また、多くの訪問者が集まるページからリンクされているページにも、多くの訪問者が集まります。
一定時間ごとに移動する、という操作を繰り返すと、訪問者数は一定の値に収束していきます。この値の対数を取ると、PageRank になります。
log6(x/0.15)
訪問者の期待値を x とした場合の計算式を上にあげておきます。 分母の 0.15 はランダムに移動する確率です。 底の 6 は PageRank の最大値が 10 になるようにするためです。 (底の値は現在では異なるかもしれません。)
さらに、小数点以下を切り捨てると、PageRank の値が算出できます。 計算式から分かるように、PageRank 3 と 4 のように、数値が 1 違うと、6倍も訪問者が異なることになります。
なお、上位表示には、PageRank だけでなく、キーワードの選び方や、出現回数、キーワードの配置などが関係しています。