canonicalタグって何? という初心者向けのcanonicalタグ入門

canonicalタグって何? という初心者向けのcanonicalタグ入門

カノニカルって10回書いてみて。カノニカル、カノニカル、カレカノ、カノニカノレ、カノニカノレ、ダレノガレ…こんにちは、三度のメシよりゲシュタルト崩壊好きな篠キチです。

いまどきのSEOは内部対策の重要度が非常に高くなった、みたいな話を先日書きましたが、じゃあもうリンクとかって意味ないの? というと決してそんなことはありません。
外部リンクを使ったチート的な外部対策はほぼ死んだと言っていいと思いますが、いわゆるPageRankによるページの評価はいまも重要です。ただ、その対策はリンクを増やして評価を上げるという方法から、評価が下がらないように対策を施すという流れに移っていると言っていいと思います。

canonicalタグが重要

ここ最近重要になっているのは、canonicalタグによる重複コンテンツの正規化です。いわゆるパンダアップデートでコピーサイトの評価は大きく下げられましたが、制作上の都合でサイト内にも意図せず同じ内容のページが重複してしまうことがあります。これを放置するのがよくない。

典型的なのはURLにwwwがあったり無かったり、index.htmlがあったり無かったり、最後に/があったりなかったり。Googleからは、これについてはそんなに気にする必要は無いという見解が出されています(リンク先はWeb担当者Forumで翻訳された記事です)が、厳密にはこれらも重複コンテンツになります。

というわけでこれらを例にして全部書き出してみるとこんな感じ。

  • http://www.hogehoge.jp/hoge
  • http://www.hogehoge.jp/hoge/
  • http://www.hogehoge.jp/hoge/index.html
  • http://hogehoge.jp/hoge
  • http://hogehoge.jp/hoge/
  • http://hogehoge.jp/hoge/index.html

仮にこの6パターンのURLでコンテンツが重複していて全部Googleにインデックスされていた場合、ページの評価が6つのURLに分散してしまい、ざっくり言うと単純にページ評価が1/6になってしまうと考えてよいです。ページ評価がなかなか上げられないこのご時世にこれは痛い。

こういう場合、headセクションに


<link rel="canonical" href="http://www.hogehoge.jp/hoge/index.html" />

のように書いておくと、仮に6パターンのURLでインデックスされていても、ページ評価をcanonicalタグに書いた正規化URLに一本化することができます。ほんとはcanonicalタグで正規化するだけじゃなくて301リダイレクトで他のURLに来たら正規化URLに転送するほうがよさげですが、それはまたの機会に。

さらに「You、正規化するURLはHTTPSにしちゃいなよ(意訳)」とGoogle Search Console(旧ウェブマスターツール)のヘルプ内に書かれてるので、SSL使えるようにしてHTTPSで正規化してあげましょう。あ、HTTPでアクセスしてきたのをHTTPSにリダイレクトさせる方法とかは別の機会に。

…httpsに決め打ちせずに同一サイト内だったら相対パスで書いておけばいいじゃんみたいな話も出てくると思いますが、同じヘルプ内で絶対パスを使用するように薦めています。よほどの信念でもないかぎり、素直に従っておきましょう。

自分自身を正規化URLとして指定してOKか否か

ちなみにこういう流れでcanonicalタグを埋め込む場合、プログラマの方が多分気になるのは“自分自身を正規化URLとして指定していいのか?” ということだと思います。当社のプログラマにも聞かれました。これができないと処理面倒ですよね、たぶん。想像ですけど。

ようするに https://www.hogehoge.jp/hoge/index.html に、自分自身を正規化URLとする形で


<link rel="canonical" href="http://www.hogehoge.jp/hoge/index.html" />

って書いてしまって問題ないのか? ということですが、これについてもWeb担当者ForumにGoogleの回答を引用した記事がまとめられています。問題ありません。

これでずいぶん手間が省けると当社プログラマも喜びを隠しきれない様子でした。

canonicalタグの使用例

意図せず重複ページになる事例としてありがちなのはパラメータ付きのURLを使った動的にページ生成するタイプで、結果は同じ内容でもパラメータの並び順にいろんなパターンが存在するのはよく見かけます。

  • https://www.hogehoge.jp/hoge/hoge.html?color=red&size=large
  • https://www.hogehoge.jp/hoge/hoge.html?size=large&color=red

そもそもこういうのは静的なURLに変換したほうがSEO上有利だという話もありますが、最近はパラメータの数がそんなに多くなければ、Googleのクローラがいい感じにインデックスしてくれますし、SearchConsole上でURLパラメータの処理方法を指定してあげればより精度を高められるようになっています。

ただ、このパラメータの並び順の違うURLが外部のサイトにリンク先として使われたりしてGooglebotにクロールされた結果、重複ページとしてインデックスされていってしまうと具合が悪いので、これもcanonicalタグで正規化しておくのがよいでしょう。

 

あと最近教えていただいた事例で、キュレーションサイト等にコンテンツ提供をして全く同じ内容のコンテンツがいろんなサイトに掲載されるなんてパターンがありがちですが、これはSEO的に効果高いと思いきや、気をつけないと逆効果になるという話を伺いました。たしかに言われてみると、パンダアップデートなどの方向性から考えても重複コンテンツとか丸パクリコンテンツとGoogleに判定される可能性は高そうです。

どっちがパクリと判断されるかはGoogle大先生のさじ加減1つな感じがしますが、これでコンテンツ提供側がパクってると判断されて、ページ評価がダダ下がりしてしまっては掲載してもらってる意味がないわけで、これは掲載時にcanonicalタグを入れてもらって引用元の記事URLに正規化してもらうとか、場合によってはキュレーションサイト側のページはnoindexしてもらうなど対応を考えるべきです…ということで、なるほど勉強になりました。

そもそも勝手にパクられてしまった場合はどうしようも無いわけですが、そういう場合はヨッピーさんという偉大な方の戦いの記録が残されておりますので、参考にされるのがよろしいかと思います。

という感じに長々と書かせていただきましたが、URLの正規化についてはまずGoogle Search Consoleのヘルプが充実しているのでこれを読んで、基本の対策をしっかり取るのが一番よいという身も蓋もない結論で、今回はこれまで。

 

画像にはフリー素材アイドル MIKA☆RIKAさんを使わせていただきました

TAG

  • このエントリーをはてなブックマークに追加
篠キチ
Planner 篠キチ shinokichi

約3年半にわたり君臨したランチェスター最年長の座を譲り、今はただの猫・鉄道・Perfume好きな不惑おじさん。好きなスタバオーダーはクワットロベンティノーホイップソイホワイトモカ。