重複コンテンツの種類とリスク|Googleの文書からも読み取るSEOでの対応策とは

SEO対策やオウンドメディア運営において「重複コンテンツ」はさまざまなリスクを生む。

重複コンテンツはSEO的な価値を欠損させるだけではなく、法的なリスクにつながることもある。

また、コンテンツマーケティングに取り組んでいるなかで、意図せず重複コンテンツが発生するおそれもあるため、注意が必要だ。

メディアの運営期間が長くなるほど、そのリスクも高まる。

そこで本記事では、Google公式の文書も読み取りながら重複コンテンツのリスクや発生原因、防止策をわかりやすく解説していきたい。

 

ホワイトペーパー制作サービス

記事制作代行サービス

 

1.重複コンテンツとは?3つの分類

 

重複コンテンツの種類と概要

重複コンテンツとは「URLが異なるにもかかわらず、内容が完全に一致、もしくはほぼ同じコンテンツ」を指す。

具体的には以下の3パターンが該当する。

  • コピーコンテンツ(いわゆる”コピペ”で作られたようなコンテンツ)
  • 同一サイト内で内容が同じ、かつURLが異なるコンテンツ
  • 同一サイト内で検索意図やキーワードが重複しているコンテンツ

検索エンジンは、重複コンテンツに該当するかどうかを「URL単位」でチェックしている。

これはGoogleのガイドラインにも明記されている。

“異なる URL で同じコンテンツが表示される(重複コンテンツと呼びます)サイトもありますが、検索エンジンでは、コンテンツごとにユーザーに表示する URL(正規 URL)が 1 つ選ばれます。”

出典:検索エンジン最適化(SEO)スターター ガイド 

 

異なるURLにおいて、その内容が「完全に」または「高い確率で」一致している状態であれば、重複コンテンツと判断されやすい。

また、一致したコンテンツが同じメディアの中にない場合(自社サイトと他社サイトなど)はコピーコンテンツに該当する。

コピーコンテンツは「盗用」を疑われるコンテンツで、検索エンジンからペナルティを課されるだけでなく、法的リスク(著作権侵害など)の温床になる。

 

1.1.コピーコンテンツ

 

自社サイトのコンテンツが、社外のコンテンツを完全にコピーしていたり、一定以上の量をコピーしていたりすると、コピーコンテンツの対象となる。

「一定以上」の基準はケースバイケースだが、一般的には「テキストの一致率が非常に高い(重複率50%以上など)」の場合に該当しやすい。

例えば、以下の文章はコピーコンテンツに該当する可能性が高い。(太字部分が一致)

例1:

検索エンジンは、コンテンツの独自性を重視し、オリジナルな情報を提供するサイトを評価する。

他サイトからの無断転載や、内容がほぼ同じページが複数存在する場合、検索順位の低下につながる可能性がある。

そのため、記事を作成する際は、単なるコピペではなく、分の言葉で再構成し、独自の視点を加えることが重要だ。

さらに、情報の正確性を確認し、読者にとって有益なコンテンツを提供することが求められる。

例2:

検索エンジンは、コンテンツの独自性を重視し、オリジナルな情報を提供するサイトを評価する。

他サイトからの無断転載や、内容がほぼ同じページが複数存在する場合、検索順位の低下につながる可能性がある。

したがってコンテンツの制作時には、引用を適切に活用しつつオリジナル要素をしっかりと含めよう。

また、読者が求める情報を的確に提供し、競合サイトとの差別化を図ることが望ましい。

上記2つの文章は50%が完全に一致している。

ここまで一致している部分が多いと、ペナルティの対象になりかねない。

ペナルティが課されると検索結果に表示されなくなり、SEO的な価値(評価)はゼロになってしまう。

また、Googleの一般検索であれば、自動的に削除された後に「DMCA削除通知」が届く可能性もあるだろう。

DMCAとは?申請手順や虚偽通告への対処方法などSEO担当者の必須知識を解説

 

1.2.同一サイト内で内容が同じ、かつURLが異なるコンテンツ

 

内容が全く同じであるにもかかわらず、複数のURLで掲載されているものも重複コンテンツだ。

前述のとおり、検索エンジンはURL単位でコンテンツの内容をチェックしている

オウンドメディア内のコンテンツ同士であっても、記事Aと記事Bの内容が同じで、なおかつURLが異なれば、重複コンテンツと判断されてしまう。

外部との重複ではないので法的なリスクは生じないが、SEO的には問題が発生しやすい

検索エンジンがどちらのコンテンツが「正」なのかを判断できず、クロールの労力が増えたり、両者をインデックスしてSEO評価が分散したりするためだ。

対策としては、後述する「URLの正規化」や表記方法の統一、記事の統廃合などがある。

 

1.3.検索意図やキーワードが重複しているコンテンツ

 

「検索意図やキーワードが重複している」場合も重複コンテンツになり得る。

実務上問題になりやすいのはむしろこちらで、一般的にいう「カニバリ(食い合い)」が発生しているケースだ。

カニバリが起こると、2のパターンと同様に、検索エンジンはどちらのコンテンツを評価すべきなのかを判断できなくなる。

両者のコンテンツに対して評価がなされ、両者が検索結果に表示された場合は、トラフィックが分散するおそれもあり、メディア運営においてはデメリットとなる。

カニバリの対処のためには、検索キーワードの調査や検索意図の理解など、SEO的な知識やスキルが必須となる。

カニバリについて、詳しくはこちらの記事で解説しているため、参考にしていただきたい。

SEOにおけるカニバリのリスクと解決方法「ニーズとキーワードの2点から評価分散を防ぐ」

 

2.重複コンテンツによる具体的なリスク

 

重複コンテンツが発生した場合、サイト運営には具体的にどのようなリスクがあるのだろうか。

具体的にみていこう。

 

コピーコンテンツに該当した場合のリスク

 

他サイトのコンテンツを無断で使用すると、法的・SEOの両面でリスクが発生する。

著作権侵害やGoogleのペナルティの対象となる可能性があるため、十分に注意したい。

 

リスク1.著作権侵害となる

 

他サイトのコンテンツをコピーすると、著作権侵害となる可能性がある。

記事の一部を引用する場合でも、適切な出典の明記引用ルールの遵守を心がけよう。

無断転載が発覚した場合、サイト運営者からの削除要請や法的措置を受けることもある。

また、著作権侵害が認められた場合は、刑事罰の対象になることもある。

さらに民事責任として、損害賠償請求の対象になるリスクもあるため、コピーコンテンツには十分に注意したい。

 

リスク2.DMCAの対象になる

 

米国でホストされているWebサービスを利用している場合は、DMCA(デジタルミレニアム著作権法)の対象になる。

Googleは米国企業であり、日本国内からの利用であってもDMCAの対象となりえる。

Googleの一般検索上でコピーコンテンツが発覚した場合、著作権者が申請すると、検索結果からコンテンツが削除されてしまう。

コンテンツを復活させるためには、決められた期間内に異議申し立てをするなど別の手続きが必要となる。

これらの手続きにも、手間や労力がかかるため、DMCAについてもしっかりと理解し、事前に対策をしておくことが望ましい。

詳しくは以下で解説しているため、ぜひ参考にしていただきたい。

DMCAとは?申請手順や虚偽通告への対処方法などSEO担当者の必須知識を解説

 

リスク3.Googleによるペナルティの対象となる

 

SEO的な側面からは、Googleによるペナルティが最も重大なリスクだ。

Googleはオリジナルコンテンツを重視するため、コピーコンテンツを含むサイトにはペナルティを科すことがある。

具体的には、検索順位の大幅な下落や、インデックスからの削除など「SEO的な価値の欠損」が起こりえる。

また、大規模なコピーサイトと判断されると、サイト全体の評価が低下し、SEO効果が大きく損なわれるため注意しよう。

 

検索意図・キーワードが重複した場合のリスク

 

同じサイト内に検索意図やキーワードが似たコンテンツが存在すると、検索エンジンがどのページを優先すべきか判断できなくなる。

この問題は、カニバリゼーション(カニバリ)と呼ばれ、SEOに悪影響を及ぼす。

 

リスク1.カニバリによるSEO的な価値の低下

 

カニバリとは、同じキーワードやニーズを持つ複数のページが検索結果で競合し、SEO評価が分散する現象だ。

カニバリが発生すると、本来1つのページに集まるはずのSEO評価が分散し、検索順位が上がりにくくなる。

また、検索エンジンが重要ではないページを優先するケースもあり、狙ったキーワードでの上位表示がされにくくなる。

さらにカニバリを修正するための工数も無視できない。

記事Aと記事Bでカニバリが発生していると、どちらかを別の検索意図やキーワードで作り変える手間と労力が発生する。

カニバリは、コンテンツの新規制作段階から、事前に回避しておくべきだといえよう。

 

リスク2.ユーザーの離脱を招く

 

同じサイト内に似た内容の記事が複数あると、ユーザーはサイト全体の信頼性や品質に疑問を抱く。

結果として、ユーザーの滞在時間が短くなり、離脱率が上昇する可能性がある。

Googleはユーザー行動を評価基準の一つとしているため、サイトの利便性が低下すると、SEO評価にも悪影響を及ぼす。

 

3.重複コンテンツが発生する原因

 

続いて、重複コンテンツが発生する原因を把握しておこう。

メディアやサイトの運営期間が長くなると、重複コンテンツが発生しやすくなるといえる。

「外部コンテンツとの重複でなければ問題ない」と考える方もいるが、SEO的に言えば確実に「損失」は出ている。

まずは発生ポイントをしっかりと把握して対策に努めよう。

 

原因1. 同じページをPC版とモバイル版で別々のURLで公開している

 

同一のコンテンツであっても、PC版とモバイル版を「異なるURL」で公開していると、重複コンテンツになりやすい。

モバイルファーストの時代になり、モバイル版(スマホ版)の構築は必須になった。

レスポンシブデザインでPC版とモバイル版を「同一のURLで」自動的に切り替えられている場合は問題ない。

しかし、PC版とモバイル版のサイトを別々のURLで運用すると、検索エンジンは重複コンテンツと判断する。

例えば以下のようにだ。

  • PC版:https://example.com/page
  • モバイル版:https://m.example.com/page

もし、どうしても別URLで運用する場合は「rel=”alternate”」タグを使用し、PC版とモバイル版の関係を検索エンジンに伝えておこう。

 

原因2.URLの表記体系が統一されておらず、同一の内容で異なるURLを作ってしまう

 

繰り返すが、検索エンジンは「URL単位」でコンテンツの内容を把握している。

同一の内容で異なるURLがあれば、重複コンテンツと判断される

例えば、下記のような場合は内容が同一であっても「別のページ」と判断されるのだ。

https://example.com/page(メイン)

https://www.example.com/page(wwwの有無)

https://example.com/page/index.html(index.htmlの有無)

https://example.com/Page(大文字・小文字の違い)

 

「example.com」ドメイン上でオウンドメディアを作成していて、上記のようにURLの表記が統一されていないと、重複コンテンツと見なされてしまう。

やっかいなのは、これらの類似URLが意図せず生成されるおそれがある点だ。

定期的なチェックやCMSのプラグインの活用により、対策体制を整える必要がある。

 

原因3. URLが動的に複数生成されている場合

 

ECサイトやブログでは、同じページが異なるURLで生成されることがある。

この場合も、意図せず重複コンテンツを生み出してしまう。

具体例

https://example.com/product?id=123

https://example.com/product?category=shoes&id=123

https://example.com/product?ref=affiliate&id=123

→全てページの内容は同一

 

特に大量のパラメータがURLに含まれると、同一の内容でも「異なるURL(ページ)」であると認識されやすい。

静的ページに変更するか、canonicalタグを設定して「正規のページ」を検索エンジンに伝えるなどの対策が必要だ。

 

原因4.「寄稿」が多い場合

 

自社サイトのコンテンツを、他社サイトに「寄稿」している場合も、重複コンテンツと判断されやすい。

「自社サイトのコンテンツ」と「寄稿先のコンテンツ」が重複するためだ。

もちろん、自社と寄稿先との間に合意が形成されていれば法的なリスクは生じない。

しかし、検索エンジンはオリジナルのコンテンツを評価するため、寄稿先のサイトが検索上位に表示され、自サイトの評価が下がるなどのリスクが生じるおそれがある。

解決策としては、以下が挙げられる。

  • 「寄稿記事の内容を一部変更し、独自性を持たせる」
  • 寄稿先サイトに「canonicalタグ」を設定してもらい、オリジナルのページを正規扱いにする
  • 寄稿記事には「nofollow」リンクを設定し、自サイトの評価を守る
  • 「寄稿コンテンツ」は自社メディアに掲載せず、リンクを設置して紹介するのみに留める

 

4.重複コンテンツの発見方法

 

重複コンテンツの発見方法には、手動による方法とツールによる方法の2種類がある。

 

4.1.コピーコンテンツの発見方法

 

検索演算子を使った手動チェック

 

コピーコンテンツの発見はそれほど難しくない。

最も簡単な方法は「手動チェック」だ。

調べたいページの任意のテキスト(MAX32文字)をダブルコーテーションで囲み、検索してみよう。

例:”CRMツールのおすすめとは”

ダブルコーテーションは「完全一致検索」のための演算子だ。

この検索で一致した文章があれば、コピーコンテンツの可能性がある。

ただし、固有名詞や固定の言い回しはどうしても完全一致になるため、確実な方法とは言い難い。

また「手動で32文字ごとにチェックする」ことは労力が大きく、大規模なチェックには適さない

 

無償のチェックツールによるチェック

 

文章同士を全体的にチェックするならば、ツールの活用がおすすめだ。

ツールを活用すれば、インターネット上でのコピーコンテンツを簡単にチェックできる。

以下は、無料の文章チェックツール「CopyContentDetector」の画面だ。

CopyContentDetector_ツールの一例①

使い方は簡単で「調査対象テキスト」にチェックしたい文章を入力し「規約に同意してコピペチェックする」をクリックする。

数分経過後に通知が来るので、画面更新を行って結果画面を見よう。

以下のように分析結果が表示される。

CopyContentDetector_ツールの一例①

「類似度判定」は類似度の高い文章の割合を「一致率判定」では単純に文字列が一致した文章の割合を表している。

 

SEO対策ツールによるチェック

 

コピペチェック機能は、SEO対策ツールに内包される場合も多い。

例えばSEOツール「Pascal」では、社内外の重複コンテンツチェック機能を提供している。

Pascal

出典:PR TIMES https://prtimes.jp/main/html/rd/p/000000019.000075553.html

 

同機能ではコピーコンテンツのチェックに加え、自社サイト内での重複(カニバリ)も検知できるとのこと。

こうしたチェックツールを使うことで、効率よくコピーコンテンツを発見できる。

 

4.2.自社サイト内での重複コンテンツ(カニバリなど)の場合

 

Google Search Consolによるチェック

 

自社サイト内での重複コンテンツは、Google Search Consoleの「セキュリティと手動による対策」で確認できる。

同項目の「手動による対策」をクリックし「問題は検出されませんでした」と表示されれば重複コンテンツは無い。

Google Search Consolによるチェック

Google Search Consol_重複コンテンツ無し

重複コンテンツがある場合は「インデックス作成」から「ページ」をチェックしよう。

「インデックス未登録」のページのコメントに「Googleにより~正規ページとして選択されていません」のような内容があれば、重複コンテンツの可能性が高い。

同一内容のコンテンツで複数のURLが生成されていないか確認してみよう。

 

SEO対策ツールによるチェック

 

上で紹介したPascalなどのSEOツールでも、カニバリを発見できる。

実際にPascalでは、サイト全体のカニバリゼーション状況を可視化する機能を提供している。

【カニバリゼーションチェック画面】

カニバリゼーションチェック画面

【カニバリを起こしているURLの詳細画面】

カニバリを起こしているURLの詳細画面

出典:カニバリゼーションの意味と対処法|パスカル ヘルプセンター

 

カニバリは「検索意図」「キーワード」が重複していることで発生する。

最終的には目視確認が必須だが、かなりの工数が必要になるため、まずはSEO対策ツールでサイト全体をチェックしてみよう。

 

5.重複コンテンツの発生を防止するには?

 

最後に、重複コンテンツの発生を防ぐための対策をまとめて紹介する。

 

対策1.事前にチェックツールを通す

 

前述のようなチェックツールを活用することで、大半のコピーコンテンツは検知できる。

特に記事コンテンツであれば、コピーコンテンツによるリスクをほぼゼロにできる。

 

対策2.URLの正規化などのテクニカルな対策

 

社内の重複コンテンツを減らすためには、テクニカルな対策による「URLの正規化」がおすすめだ。

URLの正規化は、検索エンジンがURLごとに内容を判断することを助ける。

重複コンテンツが減るだけでなく、SEO的な価値の保護やクロール効率の向上といったメリットもあるため、必ず対策しておこう。

 

有効な対策

 

  • URLパラメータ設定
  • noindexタグ
  • canonicalタグ
  • 301リダイレクト

URLの正規化が必要な理由と具体的な手順をわかりやすく解説

 

対策3.ニーズ、キーワード、コンテンツを結びつける

 

検索意図やキーワードによる重複(カニバリ)を防ぐには、コンテンツの制作方法を見直す必要がある。

具体的には「キーワード、ニーズ、コンテンツが結びついているか」を意識しよう。

キーワード選定の際に「検索ボリューム」や「難易度」だけに注目していると「内容が似ている(=検索意図が重複している)」コンテンツを生み出しやすい。

つまり、同一のニーズに対していくつもコンテンツを作ってしまい、SEO的な評価が分散する。

キーワードはひとつでも「ペルソナ」は複数想定されるし、ペルソナから派生する「ニーズ」は当然一つではない。

ニーズが異なれば、当然求められる内容も変わる。

この点については、下記記事の「3.2.ニーズ単位のカニバリを防ぐ方法」で解説している。

SEOにおけるカニバリのリスクと解決方法「ニーズとキーワードの2点から評価分散を防ぐ」3.2

キーワード、ニーズ、コンテンツをグルーピングすることで重複コンテンツの発生を防ぐことが可能だ。

 

対策4.トピッククラスターを構築する

 

「トピッククラスター」を構築することでも重複コンテンツの発生を防げる。

トピッククラスターとは、トピック(テーマ)の関連性を重視し「クラスター」のように構成する施策だ。

トピッククラスターは、中心となる「ピラーページ」と複数の「クラスターページ」を相互にリンクし合うことで、SEO的な評価を共有し、互いの検索エンジンのランキングを向上させる効果がある。

トピッククラスターとは?SEO効果を高めるモデルの作り方を解説

トピッククラスターの構築では、メインとなるピラーページのキーワードと、それに連なるクラスターページのキーワードを細かく分ける。

また、各ページで狙うニーズを整理することで「漏れなくダブりなく(MECE)」も満たせるため、重複コンテンツの発生確率は低くなる。

1ニーズ、1テーマ(ページ)の対策を心がけよう。

 

6.まとめ

 

本記事では、重複コンテンツの分類や発生するリスク、チェック方法、対策方法を網羅的に紹介してきた。

重複コンテンツには大きく3つのパターンがある。

このうち、外部サイトとの重複(コピーコンテンツ)の防止は比較的容易だ。

むしろ注力すべきは自社サイト内での重複であり、この点にはテクニカルな対策と手動での対策を組み合わせる必要がある。

まずはキーワードごとにペルソナを設定し、ニーズの整理を進めながらコンテンツを制作していこう。

 

ホワイトペーパー制作サービス

記事制作代行サービス

Index