Comment trouver du contenu en double sur votre site et améliorer votre référencement

Publié: 2022-09-13

Savez-vous comment trouver du contenu en double et le corriger ?

Sinon, vous devriez.

Le contenu dupliqué peut causer un vrai casse-tête SEO.

En fait, cela peut dérouter les robots d'exploration de Google et faire baisser votre classement, le tout à votre insu.

Vous êtes peut-être là en ce moment - vous vous demandez pourquoi certaines de vos pages ne sont pas aussi bien classées qu'elles pourraient l'être. Peut-être avez-vous passé des jours à regarder l'écran de votre ordinateur avec des yeux injectés de sang en essayant de comprendre ce qui ne va pas.

Il peut s'agir de contenu en double, surtout si vous ne l'avez jamais vérifié auparavant (et encore moins entendu parler ).

Fait amusant : le contenu dupliqué représente 29 % de l'ensemble du Web, selon l'étude la plus récente que j'ai pu trouver à partir de 2015. De nos jours, ce pourcentage est probablement encore plus élevé si l'on tient compte de la quantité de contenu qui est publiée quotidiennement.

Arrêtons donc ce problème avant qu'il ne propulse votre site Web au-dessus d'une falaise. Il est temps d'apprendre à trouver du contenu en double et à le corriger.

C'est exactement ce dont nous parlerons dans ce guide.

trouver du contenu en double

Qu'est-ce que le contenu dupliqué (et pourquoi devriez-vous vous en soucier) ?

Le contenu dupliqué est exactement ce à quoi il ressemble : des copies exactes ou des versions similaires de contenu qui apparaissent sur des sites Web distincts ou sur le même site Web.

Examinons chaque scénario :

  • Dupliquer le contenu sur des sites Web distincts - Ceci, mes amis, est du plagiat. Si une entité autre que vous s'empare d'une copie exacte de votre contenu et la publie sur son site Web, elle vole votre travail et vos idées.
    • Il en va de même si cette personne/marque/organisation utilisait votre page comme référence et n'a pas correctement paraphrasé ou réécrit le contenu dans ses propres mots. Pour en savoir plus sur le plagiat (et sa gravité), consultez cet article de l'Université d'Oxford.
    • Il en va de même si la situation est inversée : si vous copiez ou paraphrasez de manière inadéquate le contenu de quelqu'un d'autre (intentionnellement ou non), vous êtes le plagiaire et avez créé un contenu dupliqué.
  • Contenu dupliqué sur le même site Web - C'est lorsque du contenu extrêmement similaire ou exact apparaît sur plusieurs pages de votre site. Ce scénario est beaucoup plus courant, surtout si votre site Web est volumineux avec des centaines, voire des milliers de pages de contenu. Cependant, cela peut aussi arriver à des sites Web plus petits, et c'est généralement totalement involontaire.

Aide-mémoire sur les compétences en marketing de contenu rentable

Pourquoi le contenu dupliqué est-il un problème ?

Lorsque le contenu dupliqué est un contenu plagié, le problème est évident. À l'inverse, le problème du contenu dupliqué sur votre propre site se résume au classement Google.

Lorsque vous avez deux éléments de contenu (ou plus) qui semblent presque identiques, Google ne saura pas lequel classer. En fin de compte, cela fait baisser votre classement pour toutes les pages concernées, même si le contenu est fantastique.

Et les classements sont ce qui génère du trafic et des prospects. Pour que les blogs SEO fonctionnent, vos pages doivent être bien classées et apparaître en tête de Google pour vos mots clés. C'est parce que:

  1. Peu d'utilisateurs poussent leur recherche Google au-delà de la première page. En moyenne, les clics au-delà sont abyssaux - seuls 78% des utilisateurs cliquent sur quelque chose à la page deux.
  2. Comparez cela à la position n ° 1 sur Google, qui vous rapporte un taux de clics (CTR) de 6%, ce qui représente plus de 5 MILLIONS de clics moyens.

Pour que le référencement fonctionne, vous devez atteindre la première page. Et vous ne le ferez pas avec du contenu dupliqué.

ALORS - parlons de la façon de trouver du contenu en double et de le corriger à l'aide de deux excellents outils : Copyscape (versions gratuite et premium) et Siteliner.

(Au fait, la cannibalisation des mots clés est un problème de référencement lié au contenu dupliqué. Découvrez-le dans ma vidéo ci-dessous [an oldie but a goodie].)

Comment trouver du contenu en double sur votre site Web à l'aide de Siteliner

Siteliner est un outil qui analysera l'ensemble de votre site Web pour trouver le contenu en double.

Pour les sites Web plus petits, la version gratuite vous fournira de nombreuses données avec lesquelles travailler, car elle numérisera jusqu'à 250 pages une fois par mois. (Si vous avez un site plus grand ou si vous souhaitez un accès complet à toutes les données et fonctionnalités, vous devrez opter pour la version premium.)

Pour effectuer une analyse du site, entrez simplement votre URL dans le champ de recherche.

doublure de site

Lorsque votre rapport est prêt, vous verrez de nombreuses informations utiles, telles que le nombre de pages vérifiées, le pourcentage de votre contenu dupliqué et des statistiques sur la façon dont votre site se compare aux autres.

rapport gratuit siteliner

Cliquez sur "Contenu dupliqué" dans le menu en haut à gauche pour voir une ventilation détaillée.

Lorsque vous regardez votre rapport, ne vous inquiétez pas si vous voyez des pourcentages de correspondance élevés en haut, surtout s'il s'agit des pages principales de votre site Web (pages de produits, page "à propos", pages de destination, etc.).

En effet, cet outil vous montrera CHAQUE instance de contenu en double sur une page, y compris les menus, les extraits, les pieds de page et le contenu de la barre latérale.

liste de contenu dupliqué siteliner

Ce dont vous devez vous soucier, ce sont de plus gros morceaux de contenu apparaissant sur plusieurs pages.

Par exemple, la première page qui n'est pas une page de site principal sur ma liste de contenu en double est un blog. Il contient 467 mots correspondant à une autre page.

Pour vérifier si ce contenu correspondant fait partie du texte normal répété sur mon site ou quelque chose de plus sérieux, je peux cliquer sur cette entrée dans la liste pour voir exactement d'où vient le contenu dupliqué.

comparaison siteliner

Comme vous pouvez le voir, il existe trois sources différentes :

  • Contenu qui correspond à une autre page de mon site (surligné en rose)
  • Contenu de navigation (surligné en vert)
  • Contenu commun qui apparaît normalement sur mon site (surligné en gris)

Dans ce cas, j'examinerais le texte surligné en rose et déterminerais si je dois apporter des modifications à l'une ou l'autre des pages.

Vous voyez comment cela fonctionne ? C'est assez simple, et faire cela mensuellement ou trimestriellement pourrait garantir que le contenu dupliqué ne dégrade jamais votre classement Google.

Outre les problèmes de référencement tels que le contenu dupliqué, qu'est-ce qui entrave la croissance de votre entreprise en ligne ? Avez-vous du mal à embaucher, déléguer, faire évoluer ou gérer tous les petits détails ? Apprenez où vous vous trompez et obtenez la voie du succès dans ma formation gratuite.

Comment trouver du contenu en double sur le Web à l'aide de Copyscape

Au-delà de la recherche de contenu en double sur votre site, une excellente pratique exemplaire avant de publier un élément de contenu consiste à le faire passer par un vérificateur comme Copyscape, surtout si vous sous-traitez des rédacteurs. Voici comment vous :

  • Découvrez si votre contenu est 100% unique et original
  • Découvrez tous les problèmes de plagiat qui doivent être corrigés

Il existe deux façons de procéder avec deux versions de Copyscape - la version gratuite et la version premium.

Soit dit en passant, Copyscape est géré par les mêmes personnes que Siteliner. C'est un autre outil fiable utilisé par de nombreux professionnels du référencement. Il est également très abordable, ce qui en fait ma principale recommandation pour vérifier le plagiat et le contenu en double sur le Web.

Copyscape (version gratuite) : vérifiez le contenu publié pour trouver le contenu en double

La version gratuite de Copyscape vous permettra uniquement d'entrer une URL (c'est-à-dire un contenu déjà publié) pour le comparer à ce qui se trouve sur le Web. Les recherches sont limitées.

Voici comment l'utiliser :

Accédez à la page d'accueil de Copyscape, entrez l'URL du contenu que vous souhaitez vérifier dans le champ de recherche, puis cliquez sur "Go". Par exemple, je consulte un récent blog Content Hacker.

outil gratuit de copyscape

La première page qui apparaîtra sera une liste de résultats qui correspondent au contenu que vous vérifiez. Cela signifie qu'au moins une partie du texte est dupliquée.

outil gratuit copyscape - résultats de contenu correspondants

Pour cet exemple, tous les résultats proviennent de mon contenu sur le Web, y compris ma page d'auteur Amazon. C'est parfaitement bien puisque j'utilise une formulation similaire dans mes biographies et mes profils pour raconter mon histoire.

Pour regarder de plus près un résultat, cliquez sur le texte bleu. Cela vous montrera exactement quel texte est dupliqué et où il apparaît sur la page.

outil gratuit copyscape - contenu correspondant sur la page trouvée

Pour voir le texte en double en action sur votre page source, cliquez sur "Voir le contenu correspondant dans : la page source".

outil gratuit copyscape correspondant aux vues de contenu

Cela vous montrera exactement où le texte correspondant apparaît sur votre page source.

outil gratuit copyscape - contenu correspondant sur la page source

Comme vous pouvez le voir, cette instance de texte en double n'est pas un problème. C'est juste ma biographie, qui reste assez cohérente sur toutes les plateformes sur lesquelles je publie.

Si vous voyez d'autres sites répertoriés dans les résultats qui ne sont pas connectés à vous, creusez plus profondément et vérifiez le pourcentage de texte en double. Une correspondance de 1 à 4 % ne vaut pas la peine de s'inquiéter, par exemple.

pourcentage de correspondance de l'outil gratuit copyscape

MAIS, si vous voyez de vastes morceaux de texte - 7% et plus est un drapeau rouge - copiés de votre page vers la leur, ou vice-versa, vous avez besoin de réécritures, STAT.

guide de rédaction en ligne

Copyscape Premium : vérifiez le contenu non publié pour trouver le contenu en double

Je préfère Copyscape Premium à la version gratuite principalement en raison de sa simplicité et de son prix abordable.

Vous bénéficiez également de bien plus de fonctionnalités dans Premium, telles que la recherche par lots, les téléchargements de fichiers et le suivi du plagiat.

Voici comment l'utiliser pour vérifier le contenu avant de le publier et vous assurer qu'il est original :

Tout d'abord, inscrivez-vous à Premium en choisissant un nom d'utilisateur et un mot de passe.

Maintenant, voici où Copyscape Premium s'écarte un peu des outils en ligne auxquels vous pourriez être habitué. D'une part, il n'y a pas d'abonnement pour cet outil - à la place, vous achetez une somme globale de crédits, que vous dépensez ensuite en recherches.

Tarification :

  • 0,03 $ pour chaque recherche jusqu'à 200 mots
  • 0,01 $ supplémentaire par 100 mots au-delà de vos 200 premiers
  • + Vous pouvez utiliser des crédits à tout moment dans les 12 mois suivant l'achat

Ainsi, si vous souhaitez publier un article de blog de 2 000 mots via Copyscape Premium, le coût total serait de 0,18 $. (Comme je l'ai dit, abordable!)

Alors, allez-y et achetez autant de crédits que vous le souhaitez.

copyscape acheter des crédits premium

Revenez ensuite à la recherche Premium.

Nous pouvons maintenant télécharger notre fichier de contenu non publié pour le vérifier sur le Web. Sous la zone de texte (où vous pouvez coller une section de texte à vérifier), recherchez le bouton "Choisir un fichier" et cliquez dessus.

Trouvez où votre fichier de contenu est enregistré et ouvrez-le. Cliquez ensuite sur le bouton "Recherche Premium".

Pour cet exemple, je vérifie un blog qui est encore au stade de brouillon.

téléchargement de fichiers premium copyscape

La page de résultats vous montrera toutes les correspondances sur le Web avec du contenu en double.

Dans mon brouillon de blog, j'ai inclus un extrait de code pour intégrer une vidéo, et c'est le seul texte qui s'affiche comme une correspondance dans mes résultats. Cela signifie que cette pièce est 100 % originale !

résultats de téléchargement de fichiers premium copyscape

Cependant, si vous voyez des correspondances sur votre contenu qui attirent votre attention, vous pouvez cliquer sur chaque résultat pour afficher plus de détails et trouver le pourcentage de correspondance - tout comme avec la version gratuite de Copyscape.

Et, bien qu'il va sans dire, si vous découvrez que vous avez copié quelqu'un d'autre par inadvertance, modifiez votre contenu pour qu'il soit 100 % unique.

Libérez-vous des soucis de référencement tels que le contenu dupliqué : voici comment

Trouver du contenu en double sur votre site et le corriger est très important.

Mais la plupart des propriétaires d'entreprise ne réalisent même pas qu'ils commettent cette erreur de référencement, sans parler de la perte de retour sur investissement du contenu.

Je vous ai donné quelques outils et conseils pour trouver du contenu en double, mais que se passerait-il si vous n'aviez pas du tout à vous en soucier ?

Encore plus loin, et si vous n'aviez pas à vous soucier du contenu – point final ?

Et si, au lieu de cela, votre contenu était fait pour vous à partir de zéro, y compris…

  • Un rédacteur dédié formé à la rédaction en ligne et SEO
  • Directives de style de marque
  • Sujets de contenu mappés sur un calendrier de contenu (et vérifiés pour leur originalité)
  • Gestion de contenu

Pas de « et si ». Cela existe :

C'est notre nouveau service chez Content Hacker, notre moteur de création de contenu Done-For-You, qui accepte désormais les clients.

Si vous êtes prêt à transmettre du contenu à des humains qui savent comment le faire correctement, parlez-nous dès aujourd'hui pour commencer.

moteur de contenu

À propos de Julia McCoy

Julia McCoy est une entrepreneure, auteure 6x et une stratège de premier plan autour de la création d'un contenu exceptionnel et d'une présence de marque qui dure en ligne. À 19 ans, en 2011, elle a utilisé ses derniers 75 dollars pour créer une agence à 7 chiffres, Express Writers, qu'elle a fait passer à 5 millions de dollars et a vendue dix ans plus tard. Dans les années 2020, elle se consacre à la gestion de The Content Hacker, où elle enseigne aux entrepreneurs créatifs la stratégie, les compétences et les systèmes dont ils ont besoin pour créer une entreprise autonome, afin qu'ils soient enfin libérés pour créer un héritage durable et un impact générationnel.