Le terme « contenu dupliqué » a souvent une connotation négative pour les nouveaux propriétaires de sites web.
Dès que les gens commencent à lire ce qu’est le contenu dupliqué, ils commencent parfois à croire que chaque élément de contenu sur leur site web peut entraîner des pénalités de Google. Bien que cela ne soit pas vrai, le contenu dupliqué pose des problèmes de référencement.
Il est donc utile d’apprendre :
- Qu’est-ce que le contenu dupliqué ?
- Comment se produit le contenu dupliqué en matière de référencement
- Pénalités de Google pour le contenu dupliqué
- Comment trouver du contenu dupliqué pour le référencement
- Comment corriger un contenu dupliqué existant
- Comment éviter le contenu dupliqué à long terme ?
Qu’est-ce que le contenu dupliqué ?
Également connu sous le nom de contenu identique, le contenu dupliqué fait référence au contenu qui apparaît dans plus d’une URL de site web. Les gens utilisent ce terme pour décrire une correspondance exacte avec le contenu original trouvé sur d’autres sites web.
Matt Cutts, de Google, estime que 25 à 30 % de l’ensemble du contenu web est dupliqué, même si la plupart de ces contenus ne sont pas trompeurs.
Selon Google, les exemples de contenu dupliqué non intentionnel sont les suivants :
- Contenu des pages ordinaires et des pages dépouillées (telles que celles des forums en ligne)
- Pages de produits des magasins en ligne
- Versions imprimables des pages web
Comment se produit le contenu dupliqué en matière de référencement
La majorité des propriétaires de sites web ne savent pas ce qu’est un contenu dupliqué, et encore moins comment le créer. La plupart des contenus dupliqués ne sont pas intentionnels ; ils se produisent simplement.
Ce sont là quelques-unes des façons dont le contenu dupliqué se produit :
1. Variations d’URL
Les variations d’URL sont un exemple de contenu dupliqué involontaire. Les paramètres d’URL tels que le suivi des clics et le code analytique sont souvent à l’origine de ces variations.
Les identifiants de session et les versions d’imprimantes sont aussi souvent à l’origine de variations d’URL. Le contenu dupliqué se produit lorsque chaque utilisateur visite un site web auquel est attribué un identifiant de session différent de celui qui est stocké dans l’URL ou lorsque plusieurs pages de versions d’imprimantes sont indexées.
2. Contenu récupéré
Si nous vous demandions ce qu’est un contenu dupliqué, la première chose qui vous viendrait à l’esprit serait un contenu copié ou récupéré.
Après tout, c’est le contenu qui est intentionnellement plagié, et bien qu’il s’agisse d’une pratique courante, ce n’est pas la seule raison de la duplication.
On trouve généralement du contenu copié dans les sections de blog et les pages d’information sur les produits de commerce électronique.
3. Différentes versions du site web
Une autre cause de contenu dupliqué pour le référencement est l’existence de sites web ayant des versions différentes.
Si votre site web présente un contenu similaire sur différentes versions d’une page, il s’agit d’un contenu dupliqué. En voici un exemple :
- Sites web avec et sans « www » :(par exemple https://www.websitename.com/ et https://websitename.com)
- Sites web avec et sans « https » : (par exemple http://www.websitename.com/ et https://www.websitename.com)
Pénalités de Google pour le contenu dupliqué
Les personnes qui savent ce qu’est le contenu dupliqué essaient de l’éviter autant que possible parce qu’elles pensent que Google applique une pénalité pour le contenu dupliqué. Mais ce n’est pas le cas.
Dès 2008, Google a déclaré qu’il n’imposait pas de pénalité aux pages web contenant du contenu dupliqué. Cependant, même si Google n’impose pas de pénalités pour le contenu dupliqué, le fait d’avoir du contenu dupliqué a un impact négatif sur le référencement.
Le contenu dupliqué est source de confusion pour les moteurs de recherche :
- Quel contenu est le plus pertinent ?
- Où diriger les mesures de liens telles que la confiance, l’autorité ou l’équité des liens – doivent-elles être dirigées vers la page d’origine ou conservées entre les autres versions ?
- Quelles versions classer dans les pages de résultats des moteurs de recherche (SERP).
Lorsque les moteurs de recherche ne savent pas quelle version indexer, le site web en pâtit car la visibilité de la recherche et l’équité des liens entrants de chaque duplicata sont diluées. Par conséquent, les chances de classement du site web diminuent également.
Comment trouver du contenu dupliqué pour le référencement
Maintenant que vous savez ce qu’est le contenu dupliqué, quelles en sont les causes et quelles sont les pénalités liées à sa présence sur votre site web, l’étape suivante consiste à vérifier si le contenu de votre site web contient des duplicatas.
Personne n’est à l’abri. Les petits sites web ont recours à la récupération de contenu pour paraître plus fiables et faire croire aux moteurs de recherche qu’ils sont la source originale.
Voici quelques moyens de vérifier la présence de contenu dupliqué en matière de référencement :
- Utilisez Google pour rechercher un extrait de texte de votre site web. Utilisez des guillemets pour que le moteur de recherche recherche l’expression exacte.
- Utilisez des outils tels que Copyscape, Grammarly ou Siteliner, qui vérifient si le contenu est unique par rapport au contenu déjà publié.
- Consultez Google Search Console pour trouver les variations d’URL susceptibles de causer des problèmes de contenu dupliqué.
- Utilisez les outils Google pour les webmasters afin de vérifier les liens vers votre site web. Si vous remarquez un trafic important en provenance d’un site web particulier, il se peut que quelqu’un ait copié le contenu de votre site web. Vous pouvez également créer une alerte Google pour les titres d’articles similaires apparus en ligne après la publication de votre contenu.
Comment corriger un contenu dupliqué existant
Si vous avez trouvé du contenu SEO dupliqué sur votre site web ou sur celui de quelqu’un d’autre, voici quelques moyens d’y remédier :
1. Créez une redirection 301.
Une redirection 301, ou redirection permanente, indique qu’une URL a été déplacée de façon permanente de la page dupliquée vers la page originale. C’est la meilleure option si vous ne voulez pas que la page dupliquée soit accessible.
Le regroupement de pages distinctes au contenu similaire sur la page d’origine indique à l’algorithme du moteur de recherche qu’il s’agit de la bonne page à classer, ce qui a un effet positif sur la capacité de la page à être bien classée.
2. Ajouter un élément de lien canonique.
Un autre moyen d’empêcher le contenu dupliqué SEO est d’ajouter une balise canonique (c’est-à-dire rel = canonical).
Elle indique aux moteurs de recherche que la page web actuelle est une copie du site web vers lequel vous avez établi un lien dans la balise. Ainsi, les moteurs de recherche sauront quel site web vous souhaitez voir apparaître dans les résultats des moteurs de recherche.
Pour utiliser une balise canonique, ajoutez l’attribut « rel= canonical » à l’en-tête HTML de chaque page dupliquée avec l’URL de la page originale. N’oubliez pas de mettre l’URL entre guillemets.
Par exemple : <link rel = « canonical », href = « https://www.websitename.com/ »>
3. Utilisez la balise Meta Robots NoIndex.
La balise meta robots no index est un bout de code que vous ajoutez à l’en-tête HTML de la page et qui permet aux moteurs de recherche d’explorer les liens d’une page tout en leur indiquant d’exclure ces liens de leurs index.
La balise méta est la meilleure solution aux problèmes de contenu dupliqué liés à la pagination. La pagination se produit lorsque du contenu similaire apparaît sur différentes pages, ce qui donne lieu à des URL multiples.
Pour empêcher les moteurs de recherche d’indexer la page, utilisez la valeur noindex,follow :
4. Demander aux racleurs de contenu de retirer le contenu de leur site web.
Supposons que quelqu’un ait récupéré votre contenu et que vous ayez trouvé son site web. Avant de recourir à des mesures extrêmes, il y a plusieurs choses que vous pouvez faire pour résoudre le problème.
Tout d’abord, envoyez un courriel à l’administrateur ou au propriétaire du site web et dites-lui que vous avez trouvé votre contenu sur son site. Il se peut qu’il ne sache pas que le contenu vous appartient, alors laissez-lui le bénéfice du doute.
À partir de là, vous pouvez envisager les éléments suivants :
- S’il s’agit d’un site web de grande qualité, demandez-lui de vous créditer en tant qu’auteur en créant un lien vers votre site web. Vous pouvez également proposer de rédiger une version révisée de l’article en échange d’un lien retour.
- Si le site web est de mauvaise qualité, demandez-lui de retirer immédiatement son contenu.
Comment éviter le contenu dupliqué à long terme ?
Une fois que vous savez ce qu’est le contenu dupliqué et comment le trouver, vous pouvez mettre en œuvre des mesures pour l’empêcher.
Voici quelques conseils pour y parvenir :
1. Soyez cohérent avec les liens internes.
Suivre une structure de liens internes cohérente.
Si vous utilisez https://www.websitename.com/page, ne créez pas de liens vers des variantes d’URL telles que https://www.websitename.com/page/ ou https://www.websitename.com/page/index.html.
2. Utiliser des domaines de premier niveau.
Si votre contenu est spécifique à un pays, utilisez des domaines de premier niveau de code pays (ccTLD).
Par exemple, https://www.example.com/fr ou https://www.fr.example.com conviendrait mieux que https://www.example.fr pour un contenu axé sur le français.
3. Minimiser les contenus similaires.
Si vous avez de nombreuses pages similaires, envisagez de développer le contenu ou de consolider toutes les pages.
4. Définissez le domaine préféré dans Google Search Console.
Une mesure préventive pour éviter la pagination consiste à utiliser Google Search Console.
Allez dans Paramètres du site. Modifiez les paramètres sous Domaine préféré pour choisir le format d’affichage de l’URL de votre site web.
Toutefois, il convient de noter que la modification des paramètres de la Search Console de Google ne fonctionne que pour Google ; il n’y a aucune garantie que cela fonctionne pour d’autres moteurs de recherche.
5. Ajouter un badge DMCA.
Un badge DMCA est un sceau de protection qui empêche les « scrapers » de copier le contenu de votre site web. DMCA déclare qu’il effectuera un retrait gratuit si vous avez le badge sur votre site web.
Dernières réflexions : Ce qu’est le Duplicate Content + 9 étapes pour le corriger et l’éviter
Lorsque vous travaillez dur à l ‘optimisation de votre contenu, il peut être pénible de rencontrer des problèmes de contenu dupliqué. Bien que Google ait confirmé qu’il ne pénalisait pas les sites web pour le contenu dupliqué, celui-ci contribue négativement au référencement.
Maintenant que vous savez ce qu’est le contenu dupliqué et dans quelle mesure il n’est pas intentionnel, utilisez les conseils pour résoudre et prévenir les problèmes de contenu dupliqué SEO.
La gestion du contenu dupliqué peut être pénible, mais votre fournisseur d’hébergement n’a pas à l’être. Souscrivez à une offre Bluehost plan d’hébergement web aujourd’hui.
Ecrire un commentaire