2009年9月16日にGoogle Webmaster Central Channelに投稿された「Why doesn’t google.com validate?(なぜgoogle.comはWeb標準に準拠していないか?)」という動画に関しては他のサイトでも取り上げられていたことから、実際に見ていなくても、間接的に知っている人は多いのではないかと思います。

実際にGoogle.comのソースを見てみればわかると思いますが、なるほど、おそらく多くの人には理解しがたいようなソースです。はっきりいって私にもイマイチよく分かりません。通常ならDiv要素を用いるところでSpan要素を使用していたり、ドキュメント宣言でhtml5のような書き方をしている一方で、今では使われているのを見たことがないNetscape Navigator独自使用のnobr要素を使っていたり…。私の勉強は足りないだけなのかも知れませんが、どう見ても凄まじい構造になっています。

この動画の中でMatt Cutts氏がGoogleはW3Cに準拠しているからといって順位を上げたりすることはしない、なぜなら多くのウェブサイトはWeb標準に準拠していないから、といっていることはとても印象的です。

では、多くのサイトがWeb標準に準拠すれば、Googleはそれを検索順位を決める要素にするのでしょうか。

Web標準に準拠しているサイトが、Web標準に準拠しているからという理由で検索エンジンにおける上位表示に直接繋がるか、と問われれば、私はCutts氏の発言を待たずとも自分自身の経験から、ためらうことなくNoと答えると思います。そのような事実を目にしたことがないからですし、それどころか、Web標準に準拠することはしばしばエラーチェック以上の効果を生み出してはいません。

かつて全盛だったテーブルレイアウトから今日の(X)html+CSSレイアウトへの移行とセットにして語られることが多いWeb標準ですが、よくいわれるように視覚構造と文書構造を分離させるレイアウトとはあまり関係がありません。

例えば以下のソースはXHTML1.0でTable要素を入れ子にして用いたとても極端な例ですが、W3CのMarkup Validation Serviceでチェックしても問題なくパスすることができます。またもうひとつ有名なAnother HTML Lintでも100点をとることができます。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="ja" xml:lang="ja">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>サンプル</title>
</head>
<body>
	<table summary="キーワード">
		<tr>
		<td>キーワードはウ<br />キーワードのも</td>
		<td>ェブ標準で<br />う一つはSE</td>
		<td>
			<table summary="キーワード">
				<tr>
					<td>す。<br />Oです。</td>
				</tr>
			</table>
		</td>
		</tr>
	</table>
</body>
</html>

このソースは以下のように表示されます。

キーワードはウ
キーワードのも
ェブ標準で
う一つはSE
す。
Oです。

このことからも分かるようにW3Cのチェッカーではクローラーのクローリングをスムーズにするとされる視覚構造と文書構造の分離が適切に行われているかどうかを測ることはできません。W3Cのバリデーションにパスしたとして、バナーを貼っているサイトでもソースを見てみると、単にTable要素をDiv要素に置き換え、htmlの色々な属性をstyle属性に置き換えただけという例を数多く見つけることが可能です。

また上のバリデーション通過例は、もうひとつの問題も含んでいます。それは明らかにマークアップがキーワードを分断しており、それをあまり意味のないものにしているにも関わらず、そのことをチェックできないでいるということです。W3Cバリデーターは文書の論理構造もまた測ることができないのです。

これらの理由から、私はWeb標準は、今もこれからも、それだけで検索順位を決定させる要素としては不十分だと思います。

ですから、W3Cに準拠することでSEO効果がある、という今でもしばしば見かける主張は正しいとはいえません。またWeb標準で作成されたサイトだからといって検索順位が向上することに繋がるという主張も誠実なものとはいえないでしょう。とはいえ、全くの嘘と決め付けるのも少し気が早いように思います。

実際にはWeb標準に準拠するということによって誰でも思いつくような直接的なメリットを得ることは可能です。ひとつはタグの閉じ忘れ等初歩的なミスを防ぐのに役立ちますし、また、特殊文字(&や>など)をエスケープし忘れていないかをチェックすることによってそのHTMLのセキュリティを高めることにも役立ちます。また、最低限のアクセシビリティを確保するためのalt属性の指定し忘れなどを防止するのに役立ってくれるはずです。

これらのことは、SEOという視点から見れば、a要素を誤って使用することで、重要なアンカーテキストが乱れるのを防いだり、画像検索へのインデックス漏れを防いでくれたりするでしょうし、あるいは、簡単な攻撃で危険なサイトというレッテルを貼られてしまわないようにすることにも繋がります。但し、総じてこれらはSEOだけでなくサイト作成において初歩的なレベルだということで、これらが順位向上に劇的な効果を上げるわけではありません。

Web標準はむしろ、SEO上でマイナスになる要素を軽減してくれる、という視点で見るのが良いのではないかと思います。そういう点からいえば、Web標準をないがしろにしても良いということにはならないでしょう。それでも、Web標準はやはりSEOを行う者にとって(あるいは、むしろウェブサイト制作者にとって)あくまで通過点であるのが望ましいといえます。

冒頭に紹介した動画中でCutts氏はもうひとつ重要な点に触れています。それはGoogleがWeb標準に準拠しないのはより多くのメディア環境に対応するためであると同時に、Googleのパフォーマンスを向上させる目的から、という趣旨の発言です。

上述しましたが、SEOに効果を持たせるためにはWeb標準だけでは足りません。SEOに効果を出すためには、それに加えてHTMLに適切な論理構造を持たせ、キーワードの適合性を確保し、クローラーとユーザーに対し快適な導線を確保することが必要になります。もし、それらを達成するためにWeb標準が邪魔になってしまう場合は、むしろWeb標準を積極的に逸脱する必要があるでしょう。

Web標準はあくまでより良いページ作りのための第一歩として用いられるのが望ましいのではないでしょうか。