SEO対策に取り組んでいるにもかかわらず、思うように検索順位が上がらないという悩みを抱えていませんか?
その原因の1つとして、「重複コンテンツ」が考えられます。
本記事では、SEOにおける重複コンテンツの影響と対策について、詳しく解説していきます。
本記事より詳しく「SEO記事の作成方法を学びたいという方」は、下記も合わせてご覧ください。48ページのスライドで弊社の持つ記事作成のノウハウを公開しております。⇒【最新SEO情報】直近のアルゴリズムから検索上位を獲得するため記事作成手法を詳しく解説(無料)
重複コンテンツとは同一または類似したコンテンツが複数存在すること
Googleの公式な定義によると、重複コンテンツとは「同一または実質的に類似したコンテンツが、1つまたは複数のURLで利用可能な状態」を指します。
これは単に同じ文章が複数のページに存在するだけでなく、以下のようなケースも含まれます。
- 同じ内容を異なる言語で提供している場合
- 製品の説明文が複数のECサイトで使用されている場合
重複コンテンツはサイト構造やCMSの設定、または単純なミスによっても発生してしまいます。
また、重複コンテンツには「サイト内での重複」と「他サイトとの重複」の2種類があります。
サイト内での重複は同一ドメイン内での重複を指し、他サイトとの重複は異なるドメイン間での重複を指します。
どちらも SEO に影響を与える可能性がありますが、その影響の度合いや対処方法は異なります。
重複コンテンツがSEOに与える影響
重複コンテンツがSEOに与える影響は、主に4つが考えられます。
- ほかのサイトとの重複コンテンツはペナルティになる可能性がある
- 被リンクの評価が分散する
- 検索エンジンからの評価が分散される
- クローラビリティの低下
それぞれ詳細に解説します。
ほかのサイトとの重複コンテンツはペナルティになる可能性がある
Googleは、サイト内での重複コンテンツに対してはペナルティになることは基本的にありません。
しかし、他のサイトとの重複、特に大規模な重複や明らかなスパム行為(検索エンジンのクローラーを欺こうとする行為)については、ペナルティになる可能性があります。
Googleのウェブマスター向けガイドラインでは、「他のサイトのコンテンツを複製する」ことを明確に禁止しています。
Googleのウェブマスター向けガイドラインに違反すると、ペナルティの対象となる可能性があります。
ただし、引用や短い抜粋など、適切に出典を明記した上での部分的な重複は問題ありません。
自サイトのコンテンツを引用や抜粋して、ユーザーに価値のある情報を提供できているかが重要です。
被リンクの評価が分散する
SEOにおいて、被リンクは非常に重要な要素です。
通常、1つのURLに対して多くの質の高い被リンクが集まると、そのページの評価が高まり検索順位の向上につながります。
しかし、重複コンテンツが存在すると、本来1つのURLに集中するはずだった被リンクが複数のURLに分散されてしまいます。例えば、記事Aが100の被リンクを獲得しているとします。
しかし、その記事の重複ページ(記事A’)が存在し、50の被リンクを獲得しているとすると、本来記事Aが得られるはずだった評価の一部が失われてしまいます。
結果として、どちらのページも本来得られるはずだった評価を得られず上位表示できない可能性があります。
検索エンジンからの評価が分散される
重複コンテンツは、検索エンジンからの全体的な評価の分散にもつながります。
検索エンジンのクローラーは、重複コンテンツを発見すると、どのURLを正規ページとして扱うべきか判断します。
結果として、検索エンジンは重複したページそれぞれに対して評価を分散させてしまう可能性があります。
これにより、本来なら1つのページに集中するはずだった評価が複数のページに分散され、結果として全体的なSEO評価が低下する可能性があります。
また、検索結果の多様性を保つため、Googleは同じドメインから複数の類似したページを上位に表示することを避ける傾向があります。
つまり、重複コンテンツが存在することで、本来表示されるべき重要なページが検索結果から押し出されてしまう可能性もあるのです。
クローラビリティの低下
クローラビリティとは、検索エンジンのクローラーがWebサイトのページをどれだけ効率的にクロールできるかを示す指標です。
重複コンテンツは、このクローラビリティに大きな影響を与える可能性があります。
検索エンジンのクローラーは、各ウェブサイトに対して「クロールバジェット」と呼ばれる一定期間内にクロールする上限を設定しています。
重複コンテンツが多数存在する場合、クローラーは同じコンテンツを何度もクロールすることになり、クロールバジェットの無駄遣いになります。
結果として、以下のような問題が発生する可能性があります
- 新しいコンテンツや更新されたコンテンツが適時にクロールされない
- サイトの重要なページがクロールされずに見落とされる
- インデックスの更新が遅れ、最新の情報が検索結果に反映されない
さらに、大量の重複コンテンツは「低品質なコンテンツ」と判断される可能性があり、サイト全体の評価が低下する原因にもなりかねません。
したがって、重複コンテンツを最小限に抑え、クローラーが効率的にサイトをクロールさせることがSEO対策をする上で重要です。
本記事より詳しく「SEO記事の作成方法を学びたいという方」は、下記も合わせてご覧ください。48ページのスライドで弊社の持つ記事作成のノウハウを公開しております。⇒【最新SEO情報】直近のアルゴリズムから検索上位を獲得するため記事作成手法を詳しく解説(無料)
重複コンテンツが発生するケース
重複コンテンツは、様々な状況で意図せずに発生することがあります。
以下、主な発生パターンについて詳しく説明します。
サイト構造上の問題で重複コンテンツが発生する場合
サイト構造上で重複コンテンツが意図せず発生していることがあります。
考えられる要因として、主に下記の3つが考えられます。
- 「www」やURLの末尾の「/」の有無などでページが表示されている場合。
- 複数のカテゴリーに属する商品や記事が、それぞれのカテゴリーページで重複して表示される場合
- ブログなどで、類似したタグが付けられた記事が複数のタグページで重複して表示される場合。
サイト内で「www」や「/」の有無でページができている場合、重複コンテンツとして扱われる可能性があります。
例えば、「https://example.com」と「https://www.example.com」のどちらのページも閲覧できる場合、重複ページとして扱われます。
また、ECサイトや物件サイトなどで多いのですが、複数のカテゴリに属したり、異なるタグ付けされた商品やページがそれぞれのカテゴリやタグ配下で表示されている場合も重複コンテンツになりえます。
例:原宿にある家賃20万の物件が原宿エリアと家賃20万というカテゴリ配下にそれぞれページがある。
原宿カテゴリ配下:https://example.com/原宿/○○
家賃20万配下:https://example.com/20万/○○
これらの問題は、リダイレクト、canonicalタグの使用・自動生成されないように設定するなどで解決できることが多いです。
サイト外での重複
サイト外での重複は、自社のコントロール外で発生することもあり、対処が難しい場合があります。
考えられる要因として、主に下記の2つが考えられます。
- 第三者が許可なくコンテンツをコピーし、自身のサイトに掲載する場合
- ニュース記事や他サイトを寄稿する場合
寄稿コンテンツがある場合、他サイトとの重複コンテンツとみなされる可能性があります。
また、自社サイトがオリジナルであった場合にも、寄稿している他サイトがオリジナルと判断されることもあります。
サイト外との重複に対しては、オリジナルコンテンツの作成を心がけることや引用元のリンクを設置、canonicalタグの使用などが有効な対策となります。
動的URLを利用している場合
動的URLを使用するサイト、特にECサイトや大規模なデータベース駆動型のサイトでは、重複コンテンツが発生しやすい傾向があります。
- 検索フィルターを使っている場合。
- セッションID
- トラッキングパラメータ
- 言語や地域の選択
「価格が安い順」「人気順」などの並べ替え機能を利用している際、項目ごとに異なるURLが生成される場合、重複コンテンツと扱われる可能性があります。
また、アフィリエイトトラッキングやキャンペーンのトラッキングのために、URLにパラメータを追加する場合している場合も異なるURLが生成されるため、重複コンテンツになりえます。
さらに、多言語サイトの言語選択によって言語が違う同じコンテンツに異なるURLでアクセスできる場合も同様に重複コンテンツになります。
動的URLを利用している場合には、URLの正規化、rel=”canonical”の適切な使用、またはrobots.txtを使用して不要なURLのクロールを防ぐことが効果的です。
SPページや違う言語のページが別に存在する場合
レスポンシブデザインが一般的になる以前は、PC用とスマートフォン用で別々のURLを持つサイトが多く存在しました。
現在でもムーバブルタイプなどのCMSを使用しているサイトで見られ、重複コンテンツの原因となっています。
例:「https://www.example.com」と「https://www.example.com/sp」が存在している
この場合は、PCページからSPページに「alternateタグ」とSPページからPCページに「canonicaタグ」をつけるようにしましょう。
また、世界的に展開しているサイトで違う言語のページが異なるURLで作成されている場合も重複コンテンツになりえます。
例:「https://www.example.com」が国内向けのページ「https://m.example.com/us」がアメリカ向けのページ
この場合はhreflang属性を使うとよいでしょう。
重複コンテンツの確認方法
重複コンテンツの問題を効果的に解決するためには、まず自サイトの現状を正確に把握することが重要です。
以下に、重複コンテンツを確認するための主要な方法を詳しく説明します。
Google Search Console
Google Search Consoleにて重複コンテンツを確認する手順を紹介します。
①インデックス作成内の「ページ」をクリック
②ページがインデックスに登録されなかった理由の「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」をクリック
③表示されているページは、Googleが重複コンテンツと判断し、別のページを正規版として選択したことを意味します。
Search Consoleでは自サイト内での重複コンテンツしか確認できません。
重複コンテンツチェックツール
重複コンテンツを確認できるツールはいくつかありますが、ここでは無料ツールの「sujiko.jp」と「CopyContentDetector」を紹介します。
主に外部の重複コンテンツを検出するのに使用されます。
調べたいURLを入力すると、コンテンツが他のサイトで無断で使用されていないか確認できます。
こちらはコピペチェックツールとして使われることが多いです。
記事やページを作成した際、ほかのサイトと類似している割合を調べられます。
もし、類似率や一致率が高い場合はテキストを直したり、表現を変えたりすると重複を避けることができます。
検索順位チェックツールを使う
検索順位チェックツールは直接的に重複コンテンツを検出するものではありませんが、重複コンテンツとして扱われている可能性のあるページを確認できます。
弊社では検索順位チェックツールとして、「GRC」を推奨します。
特定のキーワードに対して、表示されるURLが頻繁に変わる場合、それは重複コンテンツの可能性があります。
また、Googleが複数の類似したページのうち、どれを表示すべきか判断に迷っている状態を示しています。
さらに、特定のページの日ごとの順位変動が大きい場合も、重複コンテンツがある可能性があります。
日ごとの順位状況を注意深く観察することで、潜在的な重複コンテンツの問題を早期に発見し、対処することが可能になります。
重複コンテンツの対策方法
重複コンテンツの問題が特定されたら、適切な対策を講じることが重要です。
具体的な対策方法は下記です。
- noindexタグ
- canonicalタグ
- hreflangタグ
- 301リダイレクト
- コンテンツの統合・削除
それぞれ詳しく解説します。
noindexタグ
noindexタグは、特定のページをGoogleのインデックスから除外するよう指示するためのメタタグです。
実装方法は主に2つです。
HTMLの<head>セクション内に以下のタグを追加する場合
<meta name=”robots” content=”noindex”>
HTTPレスポンスヘッダーを使用する場合
X-Robots-Tag: noindex
内容が似ているページやパラメーターURL付きなどのページに使うのが一般的です。
ただし、noindexタグはクロールを制限するためのものではなく、必ずしもindexされないわけではないため、クロールをそもそも制限したい場合は、robots.txtを使うようにしてください。
canonicalタグ
canonicalタグは、複数の類似したページが存在する場合に、どのURLが「正規ページ」であるかを検索エンジンに伝えるためのタグです。
実装方法は下記です。
HTMLの<head>セクション内にタグを追加する場合
<link rel=”canonical” href=”https://example.com/正規版のURL”>
HTTPレスポンスヘッダーを使用する場合
Link: <https://example.com/正規版のURL>; rel=”canonical”
ECサイトなどで、商品の大きさや色違いのページがある場合や絞り込み、人気順に表示するなどの機能がパラメータ付きのURLがある場合に使用されます。
canonicalタグは自己参照と呼ばれるそのページ自身が正規ページであることをGoogleに伝えるときも有効です。
また、canonicalタグを使う際は、必ず絶対パスで記述しましょう。
hreflangタグ
hreflangタグはWebページの言語を指定するための記述です。
日本語サイトのみである場合、必要ないですが、異なる言語で複数ページが存在する場合に検索エンジンに違う言語のページであることを伝えることができます。
実装方法は下記です。
<link rel=”alternate” hreflang=”ja” href=”https://examp.com/”>
上記の記述をheadタグ内に記載してください。
また、言語コードの間違いがあると無効化されてしまうため、言語コードを確認して設定するようにしてください。
また、各ページに存在する言語ページすべてのhreflangを記述するようにしましょう。
「日本」「イギリス」「アメリカ」それぞれの言語ページがある場合
〇:日本語ページに「日本」「イギリス」「アメリカ」のそれぞれのhreflangを記述
×:日本語ページに「日本」のみのhreflangを記述
301リダイレクト
301リダイレクトは、恒久的なリダイレクトを設定する方法です。
これにより、古いURLへのアクセスを新しいURLに転送し、検索エンジンにも新しいURLをインデックスするよう指示します。
実装方法は下記です。
RewriteEngine on
RewriteRule ^001$ http://www.○○.com/002 [L,R=301]
上記の赤部分をサイトに合わせて変更し、.htaccessにアップロードします。
「www」やURLの末尾の「/」ありなしを統一する際やサイトのURLを変更した場合に使います。
301リダイレクトは一時的に順位に影響する可能性もあることを心得えて置きましょう。
また、正しく設定できていないと最悪ペナルティやサイトが見れなくなる可能性もあるため、エンジニアに相談して行うようにしてください。
コンテンツの統合・削除
重複コンテンツの問題に対処する最も根本的な方法は、コンテンツそのものを統合または削除することです。
重複しているページを特定し、どちらが評価されているかを確認します。
評価されているページを正規ページとし、正規ページのURLに内容を統合します。
評価されていないページに関しては、削除、もしくは301リダイレクトを行います。
対策キーワードが重複している場合や製品ページが複数のページに分散している場合、古い情報と新しい情報が、別々にある場合などに有効です。
また、評価されていないページに向いた内部リンクや被リンクを正規ページに修正するようにしてください。
被リンクに関しては、外部サイトに連絡して変更してもらうとよいです。
良質なコンテンツがSEOで評価されやすい
大前提、SEOで評価されるためには、「良質なコンテンツ」を作成することが必要です。
弊社では、良質なコンテンツとは「ユーザーの行動を変化させる」ことを目的としたコンテンツだと考えています。
コンテンツを作成する際には、読み終わった後、ユーザーがどのような行動を取るのかを明確にすることが重要です。GoogleのSEOスターターガイドでも、興味深く有益なサイトにすること、読者の信頼を得ることなどが重要とされています。
読者に分かりやすく伝えるために、以下の3つの要素に注目しましょう。
- 見やすさ、読みやすさ: 文法の正確さ、PREP法の活用、画像の適切な配置など、読者がストレスなく内容を理解できるよう工夫しましょう。
- 信頼性の高い情報: E-E-A-T(経験、専門性、権威性、信頼性)を意識し、正確で客観的な情報を提供しましょう。
- 独自性: 他サイトにはない、独自の視点や経験に基づいた情報を盛り込みましょう。
これらの要素を意識することで、ユーザーの課題解決に貢献し、行動変容を促すような良質なコンテンツを作成することができます。
まとめ
重複コンテンツの問題は、SEOに大きな影響を与える可能性があります。
しかし、適切な対策を講じることで、この問題を解決し、検索順位の向上につなげられます。
定期的に重複コンテンツがないかチェックし、発見した場合には適切な対策をしましょう。
また、検索結果で上位表示するためには、質の高い独自性のあるコンテンツを提供することが重要です。
ユーザーにとって価値のある情報を、独自の視点で提供することで、自然と重複コンテンツの問題を回避できるだけでなく、検索エンジンからの評価も高まり順位の向上につながるでしょう。
【無料】資料ダウンロード
3分でわかるSEOコンサル資料セット
資料でわかること
- SEOサービスの利用料金
- デジタリフトが成果を出せる理由
- SEO支援サービスの進め方とサービス詳細
- なぜ今SEO対策に取り組むべきなのか