Googleの仕組み

Google はどんな検索システムになっているの?

Google で上位表示されるためにはどうすればいいのでしょう? まずは Googleの仕組みを知ることから始めましょう。

キーワード抽出の仕方

検索の重要な要素として、キーワードがありますね。 ユーザーが Google を利用するときに入力したキーワードとマッチすると、そのページが検索結果に表示されます。 そのため、あらかじめホームページのキーワードを抽出しておく必要があります。

さて、キーワードの抽出方法ですが、これは HTML の仕組みに基づいて抽出しています。 <title> タグや <h1> タグの中にある語(正確には文字列ですが)は、そのページにおいて重要である、という考え方に基づいています。 さらに、本文中で何度も用いられる語も、そのページのキーワードとして抽出されます。 そのときに、キーワード自体にも重要度が与えられます。 そのページを非常に良く表すキーワードには、高い重要度が与えられます。 重要度も<title> タグや <h1>タグの中にある語が高くなります。

さて、キーワードは、ページの内容を表しますが、インターネット全体でのそのページの価値は、キーワードからは分かりませんよね。 ホームページの価値を示す指標として、Google では PageRank を採用しています。

PageRank とは?

Google では、PageRank と呼ばれるシステムを採用しています。 簡単にいうと、各ホームページの人気度を示す数値です。 0 から 10 まであり、数字が大きいほど人気のあるページです。 人気のあるページは情報の量や質が良く、価値の高いホームページである、と判断するわけです。 PageRank 10 というのは夢のような数字で、5 や 6 はかなり有名なページになります。 個人ページなら 2 か 3 の所が多いようです。

では、PageRank はどのように使用されるのでしょう。 Google でキーワード検索をすると、たいていの場合非常にたくさんのホームページが HIT しますね。 とうてい全部は見れないので、人気サイトを優先的に表示したほうがいいですよね。 このときに、PageRank が利用されます。

PageRank だけで表示順位が決まるわけではありませんが、一般には PageRank が大きいほど上位表示されやすくなります。 なお、PageRank は最近のアルゴリズムではさほど重視されていません。 最近のグーグルアルゴリズムについては、定期的な更新をごらんください。

PageRank の決め方

PageRank はホームページの人気度を示すわけですが、ではどうやって人気度を測定するのでしょうか? 手作業でホームページを 1 つづつ見ていき、評価をしているのでしょうか? 決してそんなことはありません。 そのような方法では手間がかかりますし、適切な評価がなされる保証もありません。 Google では、HTML の重要な機能である、ハイパーリンクを利用して PageRank を決めています。 リンクがたくさん貼られているページは人気がある、と判定するわけです。

たとえていうと、世界中のホームページが、それぞれ票を持っていて、リンク先のページに投票しているわけです。 たくさんのページからリンクされているページは、多くのページから支持されている、と考えます。 反対に、ほとんどリンクされていないページは、他のページにあまり支持されていない、と考えます。

単純に票数だけ数えると、必ずしも適切ではないですね。 Yahoo など、有名なページからのリンクは、無名ページからのリンクよりも価値があるはずだからです。 そこで、リンクを貼ってくれたページの人気度も考慮します。 人気のあるページからのリンクの評価は、無名ページからのリンクよりも重要視され、PageRank への影響も大きくなります。

なお、数式を利用したPagerankの説明は、Pagerankの計算方法で解説しています。

Pagerank はもちろんですが、Googleのシステムは何か特別なことをしているのではなく、インターネットの仕組みを利用してページを評価しているわけです。 次のページから、Google で上位表示される技術を説明していきますが、これらは結局、ホームページ記述の約束ごとである HTML の仕組みに従ってホームページを製作することに基づいています。

新着記事
人気記事ベスト3
全てのホームページ製作者に
アフィリエイトで稼ぐ方法
サーチエンジン最適化
携帯サイトの作り方
レンタルサーバの選び方
ホームページ作成ソフト