2007年09月09日

無能な検索エンジン

それはズバリ、Googleです。
世間では、Yahooのほうがひどい、救いがたいという意見のほうが多いようですが。

そうやってグーグルとヤフーを引き比べることができる我々日本人はなんと幸せなのでしょう。
海外ではGoogleの一人勝ちで、選択の余地などありません。果てしなき闇の独裁社会であります。英語サイトを運営していると、身にしみます。

以前の記事で、Googleの言論弾圧を許すな、言葉狩りハンターイ、と息巻きましたが、もちろんその主張にはおかしな点がいっぱい。

ある特定のキーワードが問題だと言うが、それらで検索したら無数のページがリストされるではないか。サマリを見た限りでは、スゴイ言葉を羅列したページも上位にあって、うちのなんかあまりに可愛くて比較にならないくらい。
そもそも検索エンジンが一語一句に価値判断や意味づけをしていたら、コンピュータがパンクします。利用者の支持も失います。

広告表示において言葉が障害になるケースは理解できます。ページ内の語句を読み取り、自動的に関連性の高い広告を選んで配信するというシステムなので、ジャンルによっては何がしかの規制をかける必要はありましょう。
つまり広告表示とインデックス削除は別問題です。私も分けて対処したつもりです。

とはいうものの、Googleに対して根強い不信感をぬぐえないのは事実です。

かなり古くてうろ覚えですが、little girlというフレーズにフィルタがかかって、そういうタイトルやドメインが打撃を受けたという話を小耳にはさんだことがあるのですよ。アブナイ男たちにとってヨダレの源だとしても、あまりにありふれて普遍的な言葉だからちょっと呆れたものです。
真偽がどうなのか、詳細を調べたわけではないけど、自分が冷遇されてみると、それを思い出して、Gならやりかねんとうなずいたりもします。

ともあれ疑心暗鬼に陥って自サイト内の言葉狩りをおこなったのは、ウェブマスターたる私でした。
ただし、問題ありそうな言葉をせっせと排除した一番の理由は、検索がどうのインデックスがどうの以前に、あまり露骨な単語を置いておきたくないというものでした。(しかしま、世の中には、そうやって置き換えたへんてこな単語を使って検索する人々があとを絶たないんですねえ・・・ならば、セッ7ス、マダノレト、パンテ人、なんてのはどうでい)

キャッシュが消えた(インデックスから削除された)のに気づいたときは蒼ざめましたが、すべてのページをチェックしたわけではありません。この貧盗恋歌の中から20ページほど抜き出したら、キャッシュがないのは6枚ほど。かなりの高率ですよね。中には過去ログなど集合ページも。ほかのサイトは未チェックです。

キャッシュが消える原因は、サーバダウンが主なものです。さくらのブログは一時期非常に不安定な状況が続いていたので、改めて思い返せばしかたない面もあります。だとしても、いかにもヤヴァげなページばかり消えたままなのはなぜだ?

言葉狩りから数日経って、『パンティをはく男たち』がなぜか復活していましたが、ほかはさっぱり。
そうなったのは偶然のようにも見えます。

次の手段として、Googleサイトマップとやらを試みました。

サイトマップを登録して2週間後には、『ブラが小さい』や『完全なる性転換』なども徐々にインデックスされたのを確認しました。消えていた間にページランクもゼロに落ちたので、新規ページと同じスタートです。改めて上位を狙うには時間もかかりましょう。

それでも全部復活してよかったじゃないか。

全部かどうかは不明ですよ。その後また消えたかもしんないけど、何度も調べるヒマなどないし。

第一、サイトマップがなければクロールもキャッシュもしてやらんなんて、検索エンジンとしてのGoogleの無能ぶりを示すにほかなりません。

Googleサイトマップとは、サイト内の全頁の更新情報などを一覧表にしてGoogleに送ると、効率的にクロールしてくれるというものです。XMLファイルを特別の場所に置かねばならぬ(実際はそう厳密ではないかも)など、一般ウェブマスターには敷居が高いと聞いていたので、全く関心がありませんでした。
サイト内のリンク構造がきちんとしていれば、クローラはリンクをたどってページを見ることができるから、わざわざそんな手間を要求するのが異常なのです。
リンクの質と数がページの評価材料だと豪語し、インターネットに新たな価値観を植えつけた本人が、そのリンクを無視し、無料とはいえ特殊なツールに頼るなんて背信行為です。

ウェブ上には簡単にサイトマップを作れるプログラムも普及しているようですが、サイトマップの存在自体を知らないウェブマスターは多いことでしょう。
どんなに良いサイトでも、インデックスされなければ検索結果に上がってこないので、Google的には「存在しない」ことになります。このような不平等を放置する限り、Googleは無能です。

そりゃあ、YahooやMSNなら黙っていても全部インデックスしてくれるというわけではありません。実態はGoogleよりはるかにお粗末だと断言する人もいます。サイトマップという方法を選べるだけGは良心的という説も外れではない。
しかし世界一のシェアを誇るエンジンなのだから、基本動作であるクロール方法の改善を、プライバシーを侵害しかねない別のマップの開発よりも優先させたってよかろうにと思いますよ。
スポンサーリンク
投稿者:ルノ 23:45 | コメント(2) | トラバ(0) | ちょっとSEO
この記事へのコメント
毎日覗いてますけど、お久し振りです。
Google Adsをはじめてみました、興味は有ったのだけど敷居が高くて・・・。(笑)

最近何事にもやる気が出なくなってしまって、
なにか新しい事でもやればそれがきっかけになるかな、と。
3回目でやっと審査に合格、結局なにが悪かったのやら・・・。

今のところ、英語ページのみに表示しています、
チリが積もって山になるのか、はてまたモクズと消えるのか、
これでサイト更新も楽しみになれば良いのですけどね。
池田さん  2007年09月26日 23:46
ありがとうございます。しばしば放置ブログになっていますが、忘れずにいてくださって嬉しく思います。

> 最近何事にもやる気が出なくなってしまって
それは時として危険な兆候だったりしますが、ご自分できっかけを探す積極性がある以上、だいじょうぶですね。

審査にはねられたという話はよそでも聞きます。条件が厳しくなったのでしょうか。
テキストを基にした広告なので、画像豊富で内容が素晴らしくても、文章の少なさで引っかかることがあるようです。
とりわけ英語版では文面を考えるのが億劫ですが、似たり寄ったりであっても数行のセンテンスを付け加えるといいと思います。言葉が多いほうが検索に有利ですし。

もう通ったのだから、今後はたくさんのページに広告を載せたほうがやりがいがわきますよ。どこにでもある広告だから、訪問者に目障りということもないようです。
結果が数字(金額)で現れることは、かなりのモティベーションになるんじゃないでしょうか(気質にもよりますが)。
ルノさん  2007年09月27日 22:16
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/5379643
※宣伝色の強いトラックバックは歓迎されません。
※トラックバックには言及リンクが必要です。

この記事へのトラックバック