Comment contourner le Duplicate Content

La duplication de contenu peut représenter un véritable problème en matière de SEO. Relativement courant, le duplicate content (ou DC) est en effet traqué par les moteurs de recherche. Et ils peuvent sanctionner un site internet qu’ils considèrent comme un doublon. Grâce à de bonnes pratiques, il est possible de référencer son site en évitant les risques liés au contenu dupliqué. Certaines techniques permettent également de les contourner.

Sommaire

Définition du duplicate content

En français, on traduit « duplicate content » par « contenu dupliqué » ou « duplication de contenu ». C’est un terme couramment utilisé dans le monde du SEO pour désigner des contenus reproduits d’une url à l’autre. Ils peuvent être identiques en tout point ou simplement similaires. Les moteurs de recherche tels que Google semblent appliquer un certain seuil de tolérance, mais celui-ci fait encore l’objet de nombreux débats.

Toujours est-il que le duplicate content peut entrainer des problèmes de référencement. Avant tout, on distingue plusieurs types de contenus dupliqués :

  • Le duplicate content interne, c’est-à-dire des contenus reproduits au sein même d’un site. C’est souvent le cas des boutiques e-commerce dont les fiches produits peuvent être très similaires.
  • Le duplicate content externe, c’est-à-dire des contenus copiés sur d’autres pages web ne dépendant pas du site en question. Ce contenu peut être « volé », par exemple dans le cadre d’une stratégie de « Negative SEO ». Il peut être aussi le fruit d’une méconnaissance des bonnes pratiques SEO. Pour gagner du temps sur la production de contenus, il est en effet tentant de les copier-coller sur les sites d’un réseau, sur des agrégateurs (type TripAdvisor), sur des annuaires de liens, etc.

Partielle ou totale, la duplication de contenu est le plus souvent involontaire. Elle résulte souvent d’une mauvaise configuration d’un CMS (Content Management System, WordPress par exemple). Cette pratique peut également être délibérée, notamment pour tromper les moteurs et améliorer le référencement d’un site web. Depuis Google Panda, cette technique est toutefois réprimandée.

Les risques du duplicate content

Quand les robots d’indexation ont à traiter deux pages au contenu similaire, ils doivent arbitrer et choisir une version, celle qu’ils considèrent comme « bonne », à afficher dans les résultats. Pour cela, ils peuvent se baser sur le PageRank des pages et privilégier celle qui a le PR le plus important, peu importe qu’elle soit ou non la page à l’origine du contenu. Conséquence : les pages considérées comme des doublons perdent des positions dans la SERP (page de résultats).

Si leur Title et leur méta Description sont différents, le moteur indexe toutes les pages, mais affiche seulement les pages qu’ils considèrent comme originales. En revanche, si les pages concernées ont le même contenu et les mêmes balises, Google peut décider de ne pas les indexer pour cause de spam.

Si le contenu dupliqué a un impact négatif en matière de SEO, il porte aussi préjudice à la réputation du site. En effet, un internaute qui consulte un site web dont les contenus sont redondants bénéficie d’une mauvaise expérience. A terme, le trafic est en chute libre et le référencement est impacté.

Comment détecter les contenus dupliqués ?

Pour optimiser la visibilité de votre site internet, mieux vaut savoir s’il existe des contenus dupliqués. Pour cela, il est possible de faire de simples recherches sur Google pour détecter les urls dupliquées. Il existe également des outils pour traquer le Duplicate Content, tels que Screaming Frog, Kill Duplicate, Copyscape ou Siteliner.

Comment éviter ou supprimer le duplicate content ?

Voici quelques bonnes pratiques qui permettent d’éviter le duplicate content :

  • Créer une url par contenu original
  • Ne pas indexer tous les contenus
  • Eviter le copier-coller
  • Faire des Titles et des Meta Descriptions uniques
  • Utiliser les balises canoniques: la balise « canonical » permet d’indiquer aux robots qu’ils devraient indexer une autre page, une page de référence, que celle-ci, copie d’une url donnée.
  • Utiliser des redirections 301, notamment dans le cadre d’un projet de refonte ou de migration

Si vous n’êtes pas à l’origine des contenus dupliqués à l’extérieur de votre site, les choses se compliquent. Vous pouvez par exemple contacter le propriétaire du site qui plagie vos contenus pour lui demander de les supprimer. Il est aussi possible de se servir de l’outil de plaintes proposé par Google.

Si vous avez des problèmes de Duplicate Content, contactez nos experts. Nous vous aidons à détecter et à supprimer les contenus dupliqués qui nuisent à votre référencement.

Sommaire