Conseils de Lorelle sur le Duplicate Content

Voici donc un article de Lorelle sur le Duplicate Content, il date un peu (juillet 2007) mais comme il est en phase avec mes préoccupations du moment, je crois qu’il mérite une petite traduction.

Si vous vous demandez ce que c’est que le Duplicate Content, je vous renvoie à ma traduction de la prose de Google sur ce sujet.

Donc, après avoir attiré l’attention sur un article de Ozh qui explique qu’il est intéressant de n’afficher que des excerpts (résumé) de ses articles dans ses pages d’archives pour contourner le filtre de Duplicate Content, voilà ce que dit Lorelle :

… En réalité, Google s’attend à ce qu’il y ait du Duplicate Content sur un blog. C’est intrinsèque à leur conception. Le contenu dupliqué sera trouvé sur la page d’accueil, les pages des catégories et des tags, les résultats des recherches, les flux et beaucoup d’endroits de votre blog. C’est attendu. S’il n’en était pas ainsi, vous ne seriez pas sur un blog.

Alors que l’aide d’Ozh est super pour réduire le contenu dupliqué sur votre blog en utilisant des résumés des articles au lieu des articles complets sur les pages qui affichent plusieurs pages, n’oublions pas que cette pénalisation de page rank (ndt : le filtre de Duplicate Content n’a pas grand chose à voir avec le Page Rank page rank est ici à comprendre dans le sens de « résultats des recherches ») est destinée contre ceux qui détourne votre contenu ou contre les splogs (de Spam et BLOG) qui utilise du contenu dupliqué pour emplir leurs pages et en y ajoutant des liens de spam.

Voici mes conseils pour réduire le risque d’une pénalisation pour Duplicate Content :

  1. Utilisez les excerpts (extraits) pour les affichage de plusieurs articles à la fois. Vous pouvez faire exception si vous le voulez pour la page d’accueil et pour les fluxs (ndt : pour ma part j’utilise toujours une balise more dans mes articles pour obtenir le même type de résultat).
  2. Faites attention, lorsque vous copiez le contenu d’un autre blogueur de vous limiter à 10%du contenu ou 400 mots. Il s’agit de respecter le Copyright Law’s Fair Use restrictions (ndt : jamais entendu parler de cette histoire…). Écrivez avec vos propres mots avant et après ce contenu copié, il s’agit de différencier la copie de l’original.
  3. Ne jamais utiliser un générateur de flux (feed scraper ???) ou un plugin de génération automatique de flux qui remplisse votre site avec des extrait ou des articles complet provenant d’autres sites. Si vous utilisez des flux entrants, limitez les aux titres ou au plus aux 100 premiers mots.

En dehors de cela, détendez-vous. Souvenez-vous que c’est normal d’avoir du contenu dupliqué sur un blog. Par contre, du contenu dupliqué entre blog ne l’est pas et est pénalisé.

Mon commentaire

Je suis globalement d’accord avec ce que Lorelle a écrit mais voici quelques réflexions complémentaires :

  • Pour l’histoire du formatage des flux entrant je ne vois pas vraiment l’intérêt du conseil. Connaissez vous des blogs qui récupèreraient des articles complet d’autres blogs en ayant l’impression que Google va trouver leur contenu intéressant ?
  • Pour l’histoire des 10% ou des 400 mots il me semble que la règle n’a rien à voir avec le Duplicate Content. Jamais Google ne fixe de règle aussi stricte leurs guides sont plus des explications sur leur philosophie de leur démarche que des recettes simplistes.
  • Contrairement à ce que Fran6 disait cet été, ce type de conseil n’empêche pas du tout d’utiliser des plugins de SEO comme All In One SEO Pack. Pour un bon référencement, il faut absolument soigner son titre et ses méta (Keyword et Description) et c’est ce à quoi sert principalement ce plugin.

Tags : , ,
Commentaires
  • Francis dit :

    J’ai dit quoi moi ? ;-) J’utilise WPseo depuis cet été pour travailler un peu plus mes descriptions et les keywords. Je l’utilise aussi pour le fameux duplicate content. Résultat, 20/25% de visites en plus en provenance des moteurs de recherche et 50% de pages indexées en moins grâce au fichier robots.txt qui a aussi son importance…

    A vrai dire, je ne suis toujours pas convaincu de l’importance de toutes ces choses pour un meilleur positionnement comparé aux backlinks… Quoi qu’il en soit, je suis pour éviter les articles complets ailleurs que sur le permalien, ne serait-ce que pour éviter au visiteur de s’y perdre…

    Donc, non, pour moi ces plugins sont importants. Pas primordiaux cela dit…

  • Sylvain dit :

    Article intéressant sur le duplicate content et conseils à priori utiles si les sanctions de Google s’avèrent effectives.
    Ne maitrisant pas les tenants et aboutissants sur le sujet, à la lecture de ta traduction je me pose une question :
    Les sites tels que Mashable et OriginalSignal pour ne citer qu’eux fondent leur existence sur la duplication de contenu. Alors qu’elle avenir offrira Google à ces services qui apparaissent comme très utiles dans le filtrage des informations remontant de la blogosphère ??? (la preuve : j’ai découvert ton blog par blogasty…)

    Merci d’avance pour ta réponse

  • libretto dit :

    @ Fran6: je viens d’aller vérifier une de tes page de catégorie et tu y a collé un méta noindex. A mon avis ce n’est pas judicieux, d’autant que ton thème est bien fait avec des excerpts sur les pages d’archives… moi, mes pages de catégories sont les principales indexées en dehors de la home.
    @Sylvain : tous les outils que tu sites n’apparaissent que très très rarement dans les résultats de Google (en tous cas d’après mon expérience). Ces outils n’ont ni passé ni avenir dans Google. Par contre leur utilité est évidente pour les geeks comme nous…

  • Francis dit :

    Effectivement, j’avais viré une grande partie des pages pour voir la différence, un peu comme un test. Au final, pas de grands changements. Il faudrait que ces pages soient très souvent visitées pour changer la donne, ce qui n’est pas le cas chez moi…

    Mais en ce qui concerne ce point, j’avais lu chez SEObook que le mieux était de concentrer les visites sur les permaliens… Après, tu en aura qui te diront d’avoir un max de pages indexées… Pour quel changement au final ? C’est toujours le même problème avec le SEO… Je reste toujours sur ma réserve quand à leur intérêt malgré le fait d’en avoir parlé positivement cet été. La retour d’expérience m’a appris pas mal de choses…

    a+

  • libretto dit :

    En ce qui me concerne ces pages de catégorie ou de tags sont souvent très bien placées dans Google et sont donc assez souvent cliquées.
    Il y a aussi l’effet nombre de page indexées qui augmente en proportion le nombre de Bls internes et ça ne peut pas faire que du mal non ?
    Sinon c’est malheureux mais avec les indications données par Google on travaille plus avec des supputations et des petites cuisine personnelles qu’avec des certitudes dans cette affaire. C’est peut-être aussi le charme du référencement tout ça.

  • Francis dit :

    Je dirais que c’est un mélange entre la curiosité et la frustration le référencement… :mrgreen:

  • mike dit :

    Si on mets un no index sur les categories et les archives, comment google indexera mes articles une fois qu’ils seront passé dans les archives puisqu’il ne seront plus accessible pour lui?

  • Francis dit :

    mike > tes articles sont toujours accessibles par leur permalien !

  • libretto dit :

    Je suis d’accord avec Francis, une fois indexée les pages ne disparaissent pas de l’index de Google (à ce que je sais en tout cas).
    Par ailleurs on peut toujours accéder aux anciens articles en suivant le lien « article précédent » qui se trouve en bas de la page index.
    Cela di je persiste à dire qu’il ne faut pas affubler ses archives du tag « no index ». Si tu as vraiment peur, essaie plutôt soit de choisir un thème qui utilise les extraits dans les archives soit en utilisant la balise more à bon escient quand tu écris tes articles.

  • Mike dit :

    Ah d’accors (je débute…lol) sinon la fonction more je ne peux pas l’utiliser, c’est un blog de videos que je tiens donc j’ai 2,3 lignes de commentaires par video pas assez pour utilser more

  • yndoula dit :

    Salut!
    Je cherche depuis quelques jours un tuto qui puisse m’aider à réaliser des extraits de 15 à 20 mots avec wordpress.
    Je te remercie d’avance.
    Yndoula

Réagissez