C’est un contenu qui apparaît en double (ou bien plus) au sein d’un même site Web ou de 2 sites web différents (dans ce cas, on peut parfois parler de plagiat).
En d’autres termes, on retrouve le même contenu (texte, images…) sur plusieurs pages qui ont toutes des urls différentes.
Par exemple, si je publie exactement le contenu que vous êtes actuellement en train de lire sur une autre url (ex : sur boostyourweb.fr/blog/duplicate-content-copie), il s’agira alors d’un contenu dupliqué ! Ce serait aussi le cas si je copiais – coller ce contenu sur un autre sur un autre site web.
Google Search Console décrit le texte dupliqué comme « des blocs importants de texte au sein d’un domaine ou entre des domaines qui correspondent complètement à un autre contenu ou qui sont sensiblement similaires« .
La définition de Google du duplicate content est formulée de manière intentionnellement évasive, même s’il ne s’agit pas de la page entière ou si vous n’apportez que de légères retouches ou modifications dans le but d’éviter une correspondance exacte.
Le duplicate content est un problème récurrent dans le content marketing, et également chez les e-commerçants par exemple, qui tombent très vite dans ce piège à cause des multiples filtres disponibles pour la navigation de l’utilisateur.
Dans les cas les plus extrêmes, il peut entraîner une pénalité algorithmique par Google Panda. Contrairement à l’algorithme Google Pingouin, ce dernier ne pénalise pas l’ensemble du site Web mais uniquement les pages dupliquées, qui peuvent être déclassées ou disparaître complètement des résultats de recherche.
Pour une fois, on ne peut qu’approuver les méthodes du moteur de recherche. En effet, quel est l’intérêt d’avoir une page de résultats remplie du même contenu ?
Le duplicate content peut-il nuire à votre référencement naturel ? La réponse est oui, et ce pour plusieurs raisons :
Si vous ne produisez pas de contenu unique et qui apporte de la valeur aux internautes, Google n’a aucune raison d’afficher vos pages dans ses résultats de recherche.
En règle générale, ne cherchez pas à obtenir un pagerank élevé dans Google avec du contenu trouvé sur d’autres sites Web plus fiables. La création de duplicate content est une perte de temps, ou dans le pire des cas, peut vous exposer à une pénalité de Google.
Certaines entreprises se demandent pourquoi le duplicate content peut poser problème, en particulier si ce contenu se trouve sur un autre site, ou a été pris sur un autre site.
Voyez les choses ainsi : vous consacrez beaucoup de temps et d’efforts à la rédaction de vos contenus. Comment vous sentiriez-vous si ce contenu était dupliqué ailleurs sur le site Web de vos concurrents, écrit mot pour mot ? En sachant qu’il aurait absorbé tout le trafic et se positionnerait devant vous ? Cela ne vous mettrait-il pas en colère ? Bien sûr que oui !
Attention cependant, une problématique récurrente en e-commerce provient du fait que tous les revendeurs d’une même marque reprennent les informations donnés par le fournisseur. Auquel cas, de très nombreux sites se retrouvent avec des pages aux contenus très similaires.
Le second problème est que le moteur de recherche ne sait pas quelle page il doit classer. Si votre site comporte deux pages au contenu identique, laquelle Google doit-il proposer aux internautes ? Laquelle est la plus pertinente ?
Sans compter que, du point de vue de Google, un site comportant beaucoup de contenu dupliqué n’a pas beaucoup de valeur. L’intérêt de votre site Web est réduit, ce qui peut nuire à votre classement dans les résultats de recherche. Pour votre entreprise, cela signifie moins de trafic, et donc moins de prospects et de ventes pour votre entreprise.
Bien que Google ne sanctionne pas le duplicate content, il l’utilise comme facteur de classement. C’est pourquoi la réponse à la question « Le contenu dupliqué nuit-il au référencement ? » est un oui, et pourquoi vous devez absolument corriger le contenu dupliqué sur votre site Web si vous en avez.
Pour commencer, Google veille à ce que les personnes qui volent le contenu d’autres sites Web ne soient pas récompensées par des classements élevés. Le contenu copié est le pire type de duplicate content, et en cas de duplication malveillante, de plagiat ou de copie de texte, il est possible d’obtenir une pénalité manuelle.
Cependant, le contenu copié ne se produit pas seulement en volant d’autres sites Web. Par exemple, lorsque vous créez plusieurs pages sur un sujet similaire, comme des pages spécifiques à un lieu ou à une ville, vous pouvez créer du contenu copié sans ajouter de valeur unique sur chaque page. Certains sites Web essaient de créer du contenu pour ces pages de localisation, mais cela n’ajoute aucune valeur réelle pour les utilisateurs.
Un contenu copié, mais légèrement modifié par rapport à l’original, rend difficile la recherche de la source originale qui y correspond. Parfois, quelques mots seulement sont modifiés, des phrases entières sont changées, ou on observe l’utilisation de synonymes. Ces types de modifications sont délibérément effectués pour rendre difficile la recherche de la source originale du contenu.
Google considère que le contenu original et unique est une priorité, et les sites Web qui tentent de contourner cette règle en copiant ou en modifiant le contenu peuvent être pénalisés.
Au cours de la dernière décennie, les mises à jour de l’algorithme de Google ont dévalorisé les pages comportant peu de contenu, en accordant davantage d’importance dans les SERP aux pages avec du contenu fourni et de qualité.
Le contenu de faible valeur ajouté est exactement ce qu’il semble être, un contenu sans profondeur ou substance et qui apporte très peu d’informations utiles au lecteur. Les pages avec un faible contenu peuvent apparaître sur un site Web si les pages comportent de courtes données d’informations, ou si elles sont destinées à la navigation, comme par exemple les pages du formulaire de contact ou les pages de panier.
Voici deux façons de résoudre les problèmes de duplication causés par le contenu avec un faible contenu :
Il décrit des éléments de contenu qui sont utilisés de manière répétée sur un site Web sans apporter de valeur ajoutée. Ce type de contenu se trouve souvent dans la navigation générale, le footer du site, les biographies des auteurs ou les sections « À propos de l’entreprise » par exemple.
Comme il est normal et courant d’avoir les mêmes liens et le même texte placés à ces endroits, Google ne pénalise pas ce type de contenu dupliqué. Au contraire, les moteurs de recherche ignorent ce type de publication et ne tiennent compte que du reste du contenu.
Si vous essayez d’améliorer ou d’augmenter le nombre de mots en ajoutant simplement le même paragraphe à la fin, cela ne fonctionnera pas. Vous feriez mieux de vous consacrer à la rédaction d’un contenu unique qui apportera une valeur ajoutée aux utilisateurs qui visitent cette page.
Ce type de duplicate content peut être causé par la structure technique et URL de votre site Web. Plus précisément, les types de variations d’URL les plus courants sont les suivants :
Si votre site Web possède un certificat de sécurité (SSL), mais que les pages ne redirigent pas correctement l’URL HTTP:// vers l’URL HTTPS://, Google les considérera comme deux pages distinctes avec le même contenu. Réglez ce problème en effectuant une redirection 301 vers la bonne page.
Le même problème de duplication de page peut se produire si votre site Web différencie les pages avec ou sans le www. Réglez ce problème avec une redirection 301 vers la bonne page et utilisez un format uniforme sur toutes les pages du site Web.
Il est essentiel de déclarer à Google, dans la Google Search Console, la structure correcte des paramètres (pour le filtrage et la recherche sur le site) afin de déterminer le comportement approprié des paramètres.
Utilisez la balise rel-canonical et la fonctionnalité de paramètres de GSC pour vous assurer que Google identifie la bonne page pour les URL présentant des variations de paramètres.
Nous vous donnerons toutes les astuces pour corriger un contenu dupliqué. Débarrassez-vous du duplicate content qui peut affecter négativement le référencement.
Le contenu dupliqué est l’un des problèmes les plus importants auxquels sont confrontés les spécialistes du marketing de contenu. Comment l’éviter lors de la création de nouvelles pages ?
Vous voulez en apprendre davantage, et être guidés par des experts SEO dans votre agence de Référencement Naturel proche Cholet, et savoir appliquer les bonnes pratiques pour éviter le duplicate content ? Contactez Boost Your Web, nous vous accompagnons !