CSSの背景画像設定による隠しテキストスパム判定

隠しテキストというのは、背景と文字を同色にして人間にはわからないようにキーワードなどを詰め込むスパム行為です。検索エンジンが未熟だった頃に効果を発揮したテクニックですが、最近はあまり見かけることも話題にのぼることも無くなっています。

しかし、先日少し気になる話をTwitterで、ローカルSEOKさんがしていたので、ご紹介致します。

@pacificus 【隠しテキストはスパム|WP SEOブログ】http://t.co/VQvxqdd5 を拝見しました。作った被リンクサイトの一つが黒背景 白文字の状態でインデックスされにくかったので調べてました。
@Local__SEO なるほど。でもこれ、かなり古い記事の焼き直しなのですが、今の検索エンジンは画像の色ぐらいは判別できると思いますし、白文字を使ってるサイトは結構多いと思うので、他の原因も探ってみたほうが良いかも知れません。
@pacificus 画像認識の技術は進んでいるらしいですね。一応直してみて反応をみようと思います!
@pacificus OKです!ちなみに他の被リンクサイトは健全に下層ページまでインデックスされてます。人間に見えていれば大丈夫と思い作ったら1ヶ月以上たってもトップページしかインデックスされない状況です。新規ドメインで被リンクサイトにリンクはつけてません。
@pacificus あと手書きですのでコピペはしてないです。

不要な私のツイートを載せていませんので、話がわかりづらいかも知れませんが、要するに「黒背景+白文字のサイトがあって、Googleに白文字が隠しテキスト扱いをされているのではないか」という事ですね。

トップページ以外のページがインデックスされないというのは、サイトに大きな問題がある可能性が高いですね。(Googleのアルゴリズムペナルティと手動ペナルティ

白文字を使用する場合、背景が黒であれば何の問題もありませんが、背景が白ければ隠しテキストになります。検索エンジンはCSSも読んでいますので、CSSで黒と白を指定していれば検索エンジンも黒背景に白文字が乗っかっていることを認識することができるはずです。

しかし、背景を画像として読み込んでいて、その画像の色を検索エンジンが正しく認識できてない場合、極端な話黒い画像を白と認識されてしまった場合、白背景に白文字が乗っかっていることになります。

Googleはどこまで画像の色を識別できているのか

Googleに限らず検索エンジンは、画像に書かれた文字を認識できる所までは来ていないと言われていますが、イメージ検索を見る限りでは色に関してはある程度認識できているようです。

これは、Googleのイメージ検索で「空」というキーワードでそれぞれの色を指定して検索したものです。全体的にはGoogleやるな!と思う状態になっていると思いますが、黒とグレーに同じような色の画像が含まれていますし、白とグレーにも同じような画像が含まれています。

この4枚は、同じく「空」というキーワードでGoogleが「白」判定した画像です。確かに白い部分はありますが、白か黒かと言われたら黒に分類されてもいいような画像のように感じます。

Googleがどのように色を判定しているのかは分かりませんが、背景として読み込ませる画像によって、人間には問題ないと感じる色の組み合わせでもGoogle的には隠しテキストと判定してしまうことがあるのかも知れません。

隠しテキスト判定はロボットが行なっているのか

そもそもの疑問として隠しテキストの判定をロボットが行なっているのかという部分です。ロボットでは黒を白と判定してしまう可能性があるとしても、人間が目視チェックすればすぐに分かることです。

目視チェックだとしても白背景に薄いグレーの文字の場合にどう判断するのかという部分は気になりますが、目視チェックなのかロボットチェックなのかによって考えなければいけない事が変わってくるように感じます。

ただ、これだけ多くのサイトを一つ一つ目視チェックすることはほぼ不可能ですので、基本的にはロボットチェックで、フラグが立ったサイトを目視チェックして、あとはユーザから通報があった場合に目視チェックという形を取っているのではないでしょうか。目視チェックなしで隠しテキスト判定は行なっている可能性もありますが、それであればやはりペナルティを受けるサイトがもっと増えそうな気がします。

仮にロボットが判定しているとなると色の認識を誤ってしまう可能性が出てきます。人間の目には問題がないにも関わらずロボット的にはNGで、スパム扱いをされてしまう事があるのかも知れません。しかし、それであれば白文字を使っているサイトの多くがペナルティを受けても良いような気がしますので疑問が残ります。

真相はGoogleに聞いてみないと分からないのですが、CSSで白以外の画像を背景設定して、そこに白文字を載せたとしてもほとんどの場合、ペナルティになることはないでしょう。ただし、色判定を完全にロボットが行なっている場合には、誤判定が起こり得ると言えます。

ほとんどの場合気にする必要はないと思いますが、他に思い当たる節がないのであれば、背景色や文字の色を疑っても良いのかも知れません。というなんとも煮え切らない結論でフィニッシュです・・・

関連記事

タグ


公開日:2011年10月19日

コメント/トラックバック(0) |

カテゴリー:スパム

トラックバック&コメント

この投稿のトラックバックURL:

コメントをどうぞ

※スパムと判断したコメントは削除しています。

このページの先頭へ