サイト内部や他サイトと内容が重複したコンテンツがある状態はSEO的に望ましくないとされますが、具体的にどの様な影響があるかご存知でしょうか?
この記事では重複コンテンツの種類とSEO的な影響、対処方法を解説していきます。
SEOにおける重複コンテンツは2種類
SEOにおける重複コンテンツとは、内容が著しく類似しているか、あるいは完全に一致しているコンテンツを指します。
重複コンテンツには大きく以下の2種類が存在します。
・サイト内での重複
・他サイトとの重複
それぞれさらに発生原因によって細分化されるため、個別に詳しく見ていきましょう。
サイト内における重複コンテンツ
同一サイト内に重複コンテンツが発生してしまうケースには、次の様なものが挙げられます。
・URLの正規化のミス
wwwの有無、URL末尾のindexの有無、httpとhttpsの両方が存在する、PC用URLとモバイル用URLが両方存在するなど、異なるURLで同一のコンテンツが存在し、インデックスされてしまっているケースです。
・動的に生成されたURLの重複
異なる経路で同一のページにアクセスした場合にそれぞれ異なるURLが生成されてしまう、ECサイトで同一商品の色違い同士でそれぞれ別のURLがURLが生成されるなど、システム上の問題によって重複コンテンツが生まれてしまうケースです。
・定型文の繰り返しによる重複
全てのブログ記事の末尾に問い合わせを促す定型文を設置する、コンテンツの文字数を増やすために同じ定型文を挿入するなどによって、部分的な重複が発生するケースです。
・キーワード選定・コンテンツ設計のミスによる重複
同一の検索意図に対応する別のキーワードでコンテンツを作成した結果内容が重複してしまうなどのケースです。ツールによって機械的にキーワードを抽出した場合や、初期のコンテンツ設計にミスがあった場合などに発生しやすい傾向があります。
他サイトとの重複コンテンツ
ドメインをまたぎ、他のサイトとコンテンツが重複してしまうケースには、次の様なものが挙げられます。
・他サイトのコンテンツをコピーしてしまったことによる重複
コンテンツ作成を行う際に他サイトのコンテンツを参考にした結果、オリジナリティの無いコピーコンテンツを作成してしまうケースです。
・他サイトからコンテンツを盗用されるケース
上記とは逆で、いわゆるコンテンツをパクられるケースです。
・他サイトへコンテンツを提供したことによる重複
自サイトのコンテンツを他サイトへ提供し、両方がインデックスされてしまうことで重複コンテンツとなるケースです。
重複コンテンツがSEOに与える悪影響
重複コンテンツは基本的にGoogleに嫌われやすく、適切に対応を行わなければ、次の様なネガティブな影響を受けてしまう可能性があります。
・検索結果に表示されなくなる
・重複ペナルティを受ける可能性がある
・意図しないコンテンツが表示されてしまう可能性がある
・被リンクが分散してしまう
一つずつ解説していきます。
検索結果に表示されなくなる
Googleには検索結果の多様性を維持しようとするアルゴリズムが存在するため、他のサイトのコンテンツの内容が重複するコンテンツは検索結果に表示されなくなってしまいます。
重複ペナルティを受ける可能性がある
他サイトのコンテンツをコピーしてしまった場合、検索結果に表示されなくなるだけでなく、最悪重複のペナルティを受け、サイト全体の評価が著しく低下してしまうケースがあります。
意図しないコンテンツが表示されてしまう可能性がある
サイト内に類似するコンテンツや重複するコンテンツが存在する場合には、本来検索結果に表示させたかったはずのコンテンツとは別のコンテンツが表示されてしまう可能性があります。
被リンクが分散してしまう
GoogleはURL毎にコンテンツを認識するため、例えばwwwの有り無しの様に、内容が同一でURLが異なるページに1つずつ被リンクがついた場合、本来であれば2つ分の被リンクによる評価を得られるはずだったものが、分散してしまうことになります。
重複コンテンツを発見する方法
重複コンテンツはSEO上様々な不利益をもたらすことがわかりましたが、サイト内での重複コンテンツの有無はどの様に調べればよいのでしょうか。
重複コンテンツ発見方法について解説していきます。
他サイトとの重複を調べたい場合
作成したコンテンツが他のサイトと重複していないかを調べるためには、コピーチェックツールを使用するのがおすすめです。
テキストの完全一致はもちろん、類似度を判定してくれるツールもあるため、意図せず作成したコンテンツが他のサイトのものと重複コンテンツになってしまっていないかも調べることができます。
コピーチェックツールには無料のものから有料のものまで様々ありますが、無料かつ十分な機能を備えたものとしておすすめしたいのがcopy contents detectorです。
一度に最大4000文字までチェックすることができ、検索エンジンにインデックスされているコンテンツと入力したテキストの一致度や類似度を、危険度別に表示してくれます。
自サイト内の重複コンテンツを調べたい場合
サイト内で重複するコンテンツを調べる方法は、重複のタイプによって異なります。
定形分を使い回してしまっている場合は、下記の検索コマンドで該当するコンテンツを洗い出すことができます。
「site:ドメイン intext:”定形分の一部(30文字程度”」
これは指定したドメインの中から、コンテンツ内に指定のテキストを完全一致する形で含むものを検索するコマンドです。
注意点としては、ヒットするのはインデックスされており、かつ全てのコンテンツとは限らないという点です。
全てのコンテンツを完璧に調べるには、1ページずつチェックするしかないので、あくまでざっくりと効率よく洗い出す方法として活用してみてください。
続いて、同一のキーワードをターゲティングしているコンテンツも、以下の検索コマンドで洗い出せます。
「site:ドメイン intitle:指定キーワード」
これはタイトルに指定のキーワードを含むものを検索するというコマンドです。
同一のキーワードをタイトルに含むコンテンツは内容が重複していることが多いため、この方法でヒットしたコンテンツ同士を比較して調査してみてください。
注意点は定形分を洗い出す方法と同様です。
最後に正規化のミスによる重複ですが、これはパターンが限られるため、実際にwwwの有無、httpとhttps、indexの有無など、URLを打ち込み、ページが表示されるかどうか、表示される場合にcanonicalによる正規化が行われているかなど、調べてみましょう。
重複コンテンツへの対策・解消方法
最後に、重複コンテンツを解消する方法として、以下の4つの方法を紹介します。
・URLの正規化
・コンテンツの修正
・noindex
・削除申し立て
URLを正規化する
URLが正規されていない場合には、「301リダイレクト」、「canonicalタグの設定」「alternalteタグの設定」のいずれかの方法によって適切に正規化を行う必要があります。
301リダイレクトとは、htaccessファイルによってサーバーに転送の処理を行わせるもので、リダイレクトを設定したURLにアクセスすると、指定のURLへ転送が行われる、同時に転送元のSEO的な評価を転送先に引き継義、統合する役割も果たします。
複数のコンテンツの評価を統合したい場合に、統合元のコンテンツにアクセスできなくなっても問題ない場合には301リダイレクトによる正規化が最も確実な方法となります。
canonicalタグとはhtmlの<head>内に設置することで、検索エンジンに対して、canonicalを設置したコンテンツとcanonicalが向けられたコンテンツは同一のものであると伝える役割を果たすものです。
CanonicalはあくまでGoogleは参考として用い、301リダイレクトの様な強制力はありません。
そのため、可能であれば301リダイレクトによる正規化が望ましいでしょう。
最後にalternateタグですが、これはPC用とSP用で別々のURLが存在する場合の正規化に用いるタグです。
正規化の方法としては、PCサイトの<head>内にalternateタグを、SP用サイトの<head>内にcanonicalタグを設置します。
コンテンツを修正する
定型文の繰り返しや、KW選定ミスなどによってサイト内に類似するコンテンツ・重複するコンテンツがある場合には、コンテンツの修正を行うことで重複を解消できます。
定型文を使用することで重複が発生している場合には重複部分をリライトし、各コンテンツがオリジナルなものになるようにしてください。
同じKWをターゲティングした類似するコンテンツが共存してしまっている場合には、両者を統合した上で、一方を削除するか、301リダイレクトをかけることで正規化ができます。
また、他のサイトとコンテンツが重複してしまっている場合にもオリジナルコンテンツになるようにリライトをかければOKです。
noindexをかける
noindex とは検索エンジンに対して、そのコンテンツをインデックスしないように指令を出すもので、インデックスされないコンテンツは評価対象とならないため、重複を避けることができます。
何らかの理由によってどうしても重複したコンテンツを作成せざるを得ない場合には、Googleの検索結果に表示させたいものを除き、noindexタグを設定しましょう。
また、他のサイトにコンテンツを提供している場合にも、提供先のサイトの方でnoindexを設定してもらうことで、重複を解消できます。
削除申し立て
コンテンツをコピーされた場合には、Google Search Consoleより著作権侵害による削除リクエストを行うことができます。
これはDMCA申請とも呼ばれ、承認された場合には、コピーコンテンツがGoogleのインデックスから外れます。
ただし、申請は必ずしも通るとは限らず、またウェブ上から消えるわけではないので、Google以外の検索エンジンからは消えないという点は理解しておく必要があります。
まとめ
重複コンテンツは様々な原因から発生し、SEO的にマイナスな評価をもらってしまう可能性もあるものです。
この記事で解説した重複コンテンツの種類と見つけ方、対策方法を参考に、修正をおこなってみてください。