Googleの仕組み

Google はどんな検索システムになっているの?

Google で上位表示されるためにはどうすればいいのでしょう? まずは Googleの仕組みを知ることから始めましょう。

キーワード抽出の仕方

検索の重要な要素として、キーワードがありますね。 ユーザーが Google を利用するときに入力したキーワードとマッチすると、 そのページが検索結果に表示されます。 そのため、あらかじめホームページのキーワードを抽出しておく必要があります。

さて、キーワードの抽出方法ですが、 これは HTML の仕組みに基づいて抽出しています。 <title> タグや <h1> タグの中にある語 (正確には文字列ですが)は、そのページにおいて重要である、 という考え方に基づいています。 さらに、本文中で何度も用いられる語も、 そのページのキーワードとして抽出されます。 そのときに、キーワード自体にも重要度が与えられます。 そのページを非常に良く表すキーワードには、 高い重要度が与えられます。 重要度も <title> タグや <h1> タグの中にある語が高くなります。

さて、キーワードは、ページの内容を表しますが、 インターネット全体でのそのページの価値は、 キーワードからは分かりませんよね。 ホームページの価値を示す指標として、Google では PageRank を採用しています。

PageRank とは?

Google では、PageRank と呼ばれるシステムを採用しています。 簡単にいうと、各ホームページの人気度を示す数値です。 0 から 10 まであり、数字が大きいほど人気のあるページです。 人気のあるページは情報の量や質が良く、 価値の高いホームページである、と判断するわけです。 PageRank 10 というのは夢のような数字で、 5 や 6 はかなり有名なページになります。 個人ページなら 2 か 3 の所が多いようです。

では、PageRank はどのように使用されるのでしょう。 Google でキーワード検索をすると、 たいていの場合非常にたくさんのホームページが HIT しますね。 とうてい全部は見れないので、 人気サイトを優先的に表示したほうがいいですよね。 このときに、PageRank が利用されます。

PageRank だけで表示順位が決まるわけではありませんが、 一般には PageRank が大きいほど上位表示されやすくなります。 なお、PageRank は最近のアルゴリズムではさほど重視されていません。 最近のグーグルアルゴリズムについては、 定期的な更新 をごらんください。

PageRank の決め方

PageRank はホームページの人気度を示すわけですが、 ではどうやって人気度を測定するのでしょうか? 手作業でホームページを 1 つづつ見ていき、評価をしているのでしょうか? 決してそんなことはありません。 そのような方法では手間がかかりますし、 適切な評価がなされる保証もありません。 Google では、HTML の重要な機能である、 ハイパーリンクを利用して PageRank を決めています。 リンクがたくさん貼られているページは人気がある、と判定するわけです。

たとえていうと、世界中のホームページが、それぞれ票を持っていて、 リンク先のページに投票しているわけです。 たくさんのページからリンクされているページは、 多くのページから支持されている、と考えます。 反対に、ほとんどリンクされていないページは、 他のページにあまり支持されていない、と考えます。

単純に票数だけ数えると、必ずしも適切ではないですね。 Yahoo など、有名なページからのリンクは、 無名ページからのリンクよりも価値があるはずだからです。 そこで、リンクを貼ってくれたページの人気度も考慮します。 人気のあるページからのリンクの評価は、 無名ページからのリンクよりも重要視され、 PageRank への影響も大きくなります。

なお、数式を利用したPagerankの説明は、 Pagerankの計算方法 で解説しています。

Pagerank はもちろんですが、 Googleのシステムは何か特別なことをしているのではなく、 インターネットの仕組みを利用してページを評価しているわけです。 次のページから、Google で上位表示される技術を説明していきますが、 これらは結局、ホームページ記述の約束ごとである HTML の仕組みに従ってホームページを製作することに基づいています。

更新情報
人気記事ベスト3
全てのホームページ製作者に
アフィリエイトで稼ぐ方法
サーチエンジン最適化
携帯サイトの作り方
レンタルサーバの選び方
ホームページ作成ソフト