URL正規化タグ(canonical)で重複コンテンツ対策 Google、Yahoo、MSNに有効
検索エンジンの大手3社が、複数のURLを持つページに対し、インデックスすべきページを指定することのできるURL正規化タグ「rel="canonical"」属性をそろってサポートすると2009年2月12日に発表した。
複数のURLを持つページとは、たとえば解析用のページを準備しているサイトでは、正規のURL以外にURLの最後に「?code=123」とかいうようなタグをくっつけているページのことを指す。この場合、この「?code=123」のついていないページとついているページのどちらをインデックスすべきか検索エンジンは判断できない。よってこの「rel="canonical"」属性でインデックスすべきページを判断するという事のようである。
検索エンジンの大手3社がそろって発表した事から、SEOにも大きく影響を与えると思われるこのサポートの発表であるが、基本的にユーザ(この場合サイト管理者)の対応次第という事でどこまで浸透するかは?なところもあります。これで違法に複製されたページの抑制にもなればいいなーと思ってみたり。複製ページは無理かもなぁ。。。これを利用したスパムとか今後出てくるのかもしれませんが、、、
原文抜粋:
Google、Yahoo、Microsoftの3社が手を組んで、検索エンジンを正しい方向へ導く非公式の標準規格に対応することになった。
3社は米国時間2月12日、ウェブページにわずかなコードを追加することで「正規の」アドレス(簡単に言えば、オリジナルの最も重要なURL)を指定できる処理方法に対応すると発表した。これによって、検索エンジンに注目すべきページを伝えることが容易になり、複製ページが異なるページとして扱われることが避けられる。
これまで、インデックス化のためにウェブページを巡回する検索エンジンのロボットには、たとえば「http://www.somepage.com/index.html」と「http://www.somepage.com /index.html?lang=en」のどちらを正しいURLとして扱うべきか、判断する手段がなかった。後者のURLには、そのページの英語版を表示するようウェブサーバーに指示するパラメータが付加されている。新しい正規化タグによって、インデックス化してもらいたい最も重要なページに導くことが可能となり、上の例の場合だと、非英語圏のユーザーにとってウェブサイトの閲覧が容易になるかもしれない。
ほとんどの人は変化に気付きもしないだろうが、ユーザーがクリックする検索結果ページのURLは若干短くなり、検索結果ページに中身の同じページが重複して表示されることも多分なくなるはずだ。
さて、近い将来、rel="canonical"属性の無いページはインデックスされなくなったりするんでしょうか?それはそれで困る気もしますが、検索の効率性を考えるとその方が良いのかも。
というわけで広角機動体もrel="canonical"属性に対応してみました。
具体的には、以下のようにMTのテンプレートに記述。
全て<head>~</head>内に記述してください。
参考にしたサイトはこちら。
TOPページ
<link rel="canonical" href="<$MTBlogURL$>"/>
sitemapページ
<link rel="canonical" href="<$MTBlogURL$>sitemap.html"/>
カテゴリーアーカイブページ
<link rel="canonical" href="<$MTArchiveLink$>"/>
個別エントリーページ
<link rel="canonical" href="<$MTEntryPermalink$>"/>
日付アーカイブページ
<link rel="canonical" href="<$MTArchiveLink$>"/>
上のタグは<、>を全角で書いてあるのでコピペしないでください。
とりあえずこれで全部のページにrel="canonical"属性を付けることができました。
。。んが、なぜか技術アーカイブページだけおかしい。rel="canonical"属性で指定するページがWebアーカイブページになってる。。。

原因は調べたけどわからず。。誰か教えてください。。(T T)
(2009年2月16日 23:49)
ポチッと最新笑えるニュース→→→ [面白ニュース村] [ニュースランキング]






