Qu’est-ce que le duplicate content ?
Lorsque Google effectue un checksum, c’est-à-dire une empreinte numérique du site en cours de crawl, il en dégage des taux de similarité entre les contenus et détecte les éventuels duplicate contents. Qu’elle soit intentionnelle ou non, la duplication de contenus éditoriaux peut avoir un impact sur votre référencement naturel. Mais qu’est-ce que le duplicate content et quelles en sont les différentes formes ? Quel est l’impact de cette pratique sur le SEO ? Faisons le point.
Le duplicate content consiste à copier, de façon partielle ou intégrale, un contenu éditorial existant afin de le publier sur un site internet. Ainsi, lorsqu’un utilisateur effectue une recherche, Google va proposer les contenus les plus pertinents. De ce fait, la qualité des textes est primordiale, et pour cela 2 critères sont indispensables : la richesse sémantique et la rédaction d’un contenu unique. Que se passe-t-il lorsque Google détecte un contenu dupliqué ? Les robots prennent en compte l’URL canonical le plus populaire et déclassent les autres sites des SERPs.
Les différentes formes de duplicate content
La duplication intrasite
Le DUST, Duplicate URL, Same Text, se définit par l’accessibilité d’un même code source, donc un même contenu, via plusieurs URL. Par exemple, l’URL de votre page d’accueil fournit un contenu, lui-même accessible depuis une autre URL de votre site. Tout en sachant que pour Google il est important de publier un contenu unique par URL. Pour y remédier, la mise en place d’une balise canonical qui effectue une redirection vers l’URL canonique de votre site permet à Google de ne lire qu’un seul des contenus dupliqués. Cette balise permet également de transférer tous les backlinks concernés.
La duplication intersites
Lorsqu’un site reprend en tout ou partie un contenu déjà existant sur d’autres sites internet, il s’agit également de duplicate content. Ainsi, la reprise totale du seul titre ne constitue pas un duplicate content, contrairement à la duplication du contenu en lui-même. Pour pallier cette pratique, rédigez des articles suffisamment longs et riches et veillez bien à ce que les flux rss ne contiennent que des extraits de votre texte.
Duplicate content : impacts sur le SEO
Le duplicate content n’est pas pénalisé par Google. En effet, la seule situation inconfortable que le moteur de recherche mettra en place est une position non visible par les internautes de votre site web, son but étant d’éviter qu’il y ait des doublons dans la liste des résultats de recherche.
Ainsi, pour un référencement naturel de qualité, il est préférable de produire des contenus uniques, non dupliqués, bien que Google ne disqualifie pas cette pratique, elle reste néanmoins préjudiciable pour la visibilité de votre site.
Quelques Définitions