2001年6月7日木曜日

「Googleの天才的発明」USFL連載その6

6回目はUSフロントライン誌の12月3週号(「心も体も すっきり排毒 」号)に入っています。

コラム「Googleの天才的発明」 は、このブログ内でお読み頂けます。

やさしく解説 ウェブマーケティング
レイア・ワークマン(ACE Inc.)

前回は、グーグル誕生までのお話でした。今回は、
グーグルの検索順位決めルール(通称アルゴ)における天才的発明、「ページランク(PageRank)」(通称PR)についてお話しします。

ベータ版から本物の検索エンジンへ
1999年頃、グーグル創立者であるペイジとブリンが「The Anatomy of a Large-Scale Hypertextual Web Search Engine」、日本語で言うと………、何だろう(汗)。簡単に言えば、グーグルという検索エンジンの概要をスタンフォード大学で発表しました。

その論文(?)には、グーグルがいかに莫大な情報(ウェブサイトなど)を収集し、整理できるのかが書かれていました。これは今でもウェブで読めます。SEOをやっている人なら、何度も読んでいることでしょう。しかし残念ながら、それ以来グーグルは、自分のアルゴについて、一度も公にはしていません(涙)。
その中で、各ウェブページの重要度を定量化して測定する、ある指標が提唱されています。それがPRなのです。下の枠内はグーグルサイトからの引用です。

結局PRって何?
要するに、自分のサイトへのリンクを多く貼られているサイト、中でもPRの高い(言い換えれば重要度の高い)サイトにリンクを多く貼られているサイトは、評価が高いということです。リンクを貼ってもらう=相手に認められているということなので、どれだけ多くの人(サイト)に認められているかが考慮されるわけです。
従来の検索エンジンは、ページの内容と検索語との関連性の高さだけで検索結果の順位付けをしていたので、サイト自体の価値も指標に入れた、このPRという順位付けはまさに画期的でした。

GoogleによるPRの説明
PageRankTM は、ウェブの膨大なリンク構造を用いて、その特性を生かします。ページAからページBへのリンクを、ページAによるページBへの支持投票とみなし、Googleはこの投票数により、ページBの重要性を判断します。

しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、その票を受け取ったページを「重要なもの」にしていくのです。こうした分析によって高評価を得た重要なページには高いPageRankTM (ページ順位)が与えられ、検索結果内の順位も高くなります。


あなたの会社のサイトのPRは?
ここまで読んだサイトオーナーさんは、自分のサイトのPRが気になりますよね。ちなみに写真は、グーグルツールバーといい、これでPRを確認できます
(日本語版のダウンロードは toolbar.google. com/intl/ja/ から)。
PRの値は0から10まで。グーグルにキャッシュされていないサイトや、罰則を食らっているサイトはページランクバーがグレーになります。PRが0なら、新しいサイトか、リンクがない、またはグーグルに嫌われたサイトです。

ちなみに、www.google.co.jpのPRは9(10じゃない!)。言語にもよりますが、一般にPR6以上のサイトを作るのは簡単ではないとされています。ただ、正しいサイト作りをしていれば、PR5までは必ず行けるでしょう。

2001年5月7日月曜日

「ページランクと検索エンジンスパム」USFL連載その7

7回目はUSフロントライン誌の1月1週号(「新春号 」号)に入っています。

コラム「ページランクと検索エンジンスパム」 は、このブログ内でお読み頂けます。

前回(12月3週号)は、グーグルのページランク(PR)について説明しました。PR値が高いと、検索結果内の順位も高くなります。
今回は、このPRを意図的に操作するスパムについてお話ししたいと思います。


グーグル爆弾を体験!
www.google.comで「failure」(失敗)を検索してみてください。
第1位に表示されるサイトは何か予想できますか? ぜひお試しあれ。
検索言語対象を「英語」に設定していれば、画面右に「Why these results?」というグーグル社の広告も一緒に表示されるはずです。
それを読めば、なぜその検索語で”あのサイト“がトップに来たのか分かります。
これはPRの一種の弱点をついた技です。PR値を操作して、検索結果の上位に表示されるようにしているのです。
ちなみに「google bombing」なんて呼ばれています。

グーグル創立者の誤算?
前回触れたグーグルの創立者が書いた論文(?)の中に、このようなPRの操作について触れた面白い箇所があります。曰いわく「PRは、まず商用操作され得ない。最悪、(PRの)評価の高いサイトからリンクを買うことはできるが、お金がかかるので、さほど心配は要らない」と自信を持って断言していました。
しかし、近年では、検索結果の上位にサイト表示させることの意味を知らないサイトオーナーさんはいないに等しくなりました。
そのため、色々な手を使ってPRを操作し、値を高めようとするSEO業者さんも存在します。
そうした中、PR値を上げるため、予想された” リンク買い“の他にも、ひと昔前によく見かけたリンクファーム(PRを上げるためのリンク集の量産)、相互リンク(お互いにリンクを貼り合う行為)、コメントスパム(ブログへの強引な書き込み)など様々な手法が見られます。
まあグーグル創立当初は、検索エンジンがここまでビジネスに重大な影響を与えることを予測し切れてなかったのかも。もしかしたら、創立者自身が一番驚いているのかもしれません(笑)。

グーグルのスパムへの取り組み
グーグルのエンジニア軍団は、PRが操作されないように対抗策を練っています。つい最近、グーグルの有名なエンジニアの一人、マット・カッツはある会議で「相互リンクは、(PR値を上げる手法としては)全く無意味になった」という発言をしました。
また去年あたり、コメントスパム(自社サイトのURLを強引に多数投稿し、リンク数を増やす検索エンジンスパム)に対抗すべく、グーグルは、リンクのHTMLタ
グに「rel="nofollow"」が入っていれば、PRのリンクとしてカウントしないことにしました。他の検索エンジンも同じようにしています。今では、主なブログソフトも、書き込みの中のハイパーリンクにこのタグを入れ、検索エンジンがそのリンクを自動的に無視するようにしているようです。PR上げ作
戦によく使われていたwww.wikipedia.orgも、同じくこのタグを使うようになったそうです。
色々な検索エンジンスパムに対抗しているグーグルですが、それでも、検索結果を手動でいじる・操作するのはポリシーとして避けています。商用目的に操作できてしまうと、検索エンジンの本来の意味を失うと彼らは信じているからです。私もそう信じています。
しかしヤフーはなぁ……。