CSSの背景画像設定による隠しテキストスパム判定
隠しテキストというのは、背景と文字を同色にして人間にはわからないようにキーワードなどを詰め込むスパム行為です。検索エンジンが未熟だった頃に効果を発揮したテクニックですが、最近はあまり見かけることも話題にのぼることも無くなっています。
しかし、先日少し気になる話をTwitterで、ローカルSEOのKさんがしていたので、ご紹介致します。
不要な私のツイートを載せていませんので、話がわかりづらいかも知れませんが、要するに「黒背景+白文字のサイトがあって、Googleに白文字が隠しテキスト扱いをされているのではないか」という事ですね。
トップページ以外のページがインデックスされないというのは、サイトに大きな問題がある可能性が高いですね。(Googleのアルゴリズムペナルティと手動ペナルティ)
白文字を使用する場合、背景が黒であれば何の問題もありませんが、背景が白ければ隠しテキストになります。検索エンジンはCSSも読んでいますので、CSSで黒と白を指定していれば検索エンジンも黒背景に白文字が乗っかっていることを認識することができるはずです。
しかし、背景を画像として読み込んでいて、その画像の色を検索エンジンが正しく認識できてない場合、極端な話黒い画像を白と認識されてしまった場合、白背景に白文字が乗っかっていることになります。
Googleはどこまで画像の色を識別できているのか
Googleに限らず検索エンジンは、画像に書かれた文字を認識できる所までは来ていないと言われていますが、イメージ検索を見る限りでは色に関してはある程度認識できているようです。
- 黒
- グレー
- 白
- 青
- 黄
- 茶
- 赤
- 紫
- ピンク
これは、Googleのイメージ検索で「空」というキーワードでそれぞれの色を指定して検索したものです。全体的にはGoogleやるな!と思う状態になっていると思いますが、黒とグレーに同じような色の画像が含まれていますし、白とグレーにも同じような画像が含まれています。

この4枚は、同じく「空」というキーワードでGoogleが「白」判定した画像です。確かに白い部分はありますが、白か黒かと言われたら黒に分類されてもいいような画像のように感じます。
Googleがどのように色を判定しているのかは分かりませんが、背景として読み込ませる画像によって、人間には問題ないと感じる色の組み合わせでもGoogle的には隠しテキストと判定してしまうことがあるのかも知れません。
隠しテキスト判定はロボットが行なっているのか
そもそもの疑問として隠しテキストの判定をロボットが行なっているのかという部分です。ロボットでは黒を白と判定してしまう可能性があるとしても、人間が目視チェックすればすぐに分かることです。
目視チェックだとしても白背景に薄いグレーの文字の場合にどう判断するのかという部分は気になりますが、目視チェックなのかロボットチェックなのかによって考えなければいけない事が変わってくるように感じます。
ただ、これだけ多くのサイトを一つ一つ目視チェックすることはほぼ不可能ですので、基本的にはロボットチェックで、フラグが立ったサイトを目視チェックして、あとはユーザから通報があった場合に目視チェックという形を取っているのではないでしょうか。目視チェックなしで隠しテキスト判定は行なっている可能性もありますが、それであればやはりペナルティを受けるサイトがもっと増えそうな気がします。
仮にロボットが判定しているとなると色の認識を誤ってしまう可能性が出てきます。人間の目には問題がないにも関わらずロボット的にはNGで、スパム扱いをされてしまう事があるのかも知れません。しかし、それであれば白文字を使っているサイトの多くがペナルティを受けても良いような気がしますので疑問が残ります。
真相はGoogleに聞いてみないと分からないのですが、CSSで白以外の画像を背景設定して、そこに白文字を載せたとしてもほとんどの場合、ペナルティになることはないでしょう。ただし、色判定を完全にロボットが行なっている場合には、誤判定が起こり得ると言えます。
ほとんどの場合気にする必要はないと思いますが、他に思い当たる節がないのであれば、背景色や文字の色を疑っても良いのかも知れません。というなんとも煮え切らない結論でフィニッシュです・・・
関連記事
- SESから学ぶこれからのSEO対策とは
- 盗作ブログネタが多くて恐縮ですが・・・
- 基本的に301リダイレクトでペナルティは引き継がれない
- タイトルを頻繁に変更するとペナルティを受ける可能性がある
- タイトルタグとユニークなサイト名の重要性



















