Découverte intéressante sur le Duplicate Content dans Google

duplicate contentA la faveur d’une erreur dans l’emploi de la balise « more » sur un de mes articles WordPress, j’ai fait une découverte intéressante ou plutôt je crois que j’ai obtenu la confirmation de ma théorie sur le Duplicate Content.

Mon histoire concerne un article que j’ai écrit sur le snippet dans google et qui, après sa publication est arrivé N°1 dans les résultats de Google (SERP) sur une requête puis qui a disparu complètement de tous les résultats avant de réapparaitre de nouveau N°1.

Voici donc les faits, mes commentaires et mes conseils sur cette expérience passionnante :

Les faits

  1. Le 29 Novembre, je publie mon article sur le Snippet Google. Ma balise More est située avant le dernier paragraphe de mon texte assez long.
  2. Je fait un peu de social bookmarking pour aider au référencement de cet article.
  3. Quelques jours plus tard (je n’ai pas noté la date) cet article arrive N°1 dans les résultats de Google (il faut dire que la requête n’est pas du tout concurrentielle, même si WRI est présent sur la première page…)
  4. Mon article reste 1 jour ou 2 à cette place.
  5. Moins d’une semaine après sa publication mon article disparait de la première place et il n’est pas non plus dans les 100 premiers résultats de Google. Tout ce passe comme s’il était désindexé ou blacklisté. Mon site apparait sur la 2° page sur la requête avec un article qui n’a rien à voir mais qui contient le titre de mon article dans ses liens relatifs.
  6. Je relance une campagne de social Bookmarking sans effet.
  7. Le 4 décembre je pose une question sur ce cas intéressant dans le forum de Google pour les webmasters.
  8. Notez qu’avant l’étape qui suit, ma campagne de Social Bookmarking est suspendue depuis 2 ou 3 jours.
  9. Après avoir lu les réponses données à ma question et considéré cette histoire de Duplicate Content je modifie l’emplacement de ma balise « More » dans mon article vers 14h00 le 7 décembre. Elle se trouve maintenant juste avant l’image, à 3 paragraphes du début de l’article.
  10. Le 7 décembre à 19h00, mon article est redevenu 1° sur la requête « Snippet Google » dans Google. La réapparition a eu lieu entre 0 et 5h00 après que j’ai mis en ligne ma modification.

Mon commentaire

Quand Google a indexé ma page il a tout de suite considéré qu’elle était très pertinente mais quand quelques heures plus tard il a repéré que ce contenu se répétait de page en page (5 pages de tag + 1 page de catégorie), il a appliqué le filtre de Duplicate Content et retiré ma belle page de son indexe.

Lorsque j’ai modifié la quantité de texte qui se répétait (en changeant la position de la balise More) j’ai fait juste ce qu’il fallait pour repasser entre les mailles du filet Duplicate Content.

Comme pour toutes ces histoires de référencement et de SEO, je ne suis pas absolument certain de mes conclusions, mais on dirait bien que j’ai mis en évidence que le filtre de Duplicate Content est un filtre qui s’applique en temps réel et que c’était bien lui qui me pénalisait.

Je n’en revient toujours pas de la vitesse de prise en compte de ma modification. C’est ce qui me fait le plus douter de ma théorie…

Mes conseils :

  • Contrairement à ce que certains continuent de penser, il faut aussi considérer ses pages d’archives (en tout cas pour les catégories et les tags) comme des pages de contenu intéressant et ne surtout pas mettre de méta « noindex » sur ces pages.
  • Actuellement, plus de 25 % de mes visiteurs en provenance de Google aboutissent sur mes pages de tags ou de catégories. Elles sont donc bien considérées comme pertinentes par Google.
  • Les pages des tags et des catégories sont des pages très intéressantes pour Google et pour nos visiteurs. Ce sont des pages avec du contenu original (combinaison des résumés des articles du blog) et très utile. Elles permettent aux visiteurs intéressés de faire leur marché sur les articles que l’on a écrit dans la thématique qui les intéresse (le tag ou la catégorie).
  • Il faut soit positionner sa balise more (pour les non WordPressiens c’est elle qui permet de couper les articles avec un « lire la suite ») assez haut dans son texte soit empêcher WordPress de montrer une trop grande partie des articles dans les pages qui affichent plusieurs articles (accueil, archives…) en utilisant des Thèmes qui affichent les Excerpts pour ces pages (voir aussi les conseils de Lorelle sur ce sujet).
  • Il est très « rentable » de chercher à référencer particulièrement ces pages de tags et de catégories. Pour cela des plugins comme Category Autolink (qui vient d’ailleurs d’être mis à jour…) peuvent vous aider en renforçant vos liens internes vers ces pages. Du social bookmarking sur ces pages est aussi très efficace (mais effet peut-être plus court terme, feu de paille lié à la prime fraicheur).
  • Le problème que je rencontre aujourd’hui dans cette approche est que je n’arrive pas encore à contrôler le snippet des pages de tag. Pour l’instant on ne peut avoir que le snippet du dernier article tagué avec le tag en question alors que ce n’est pas nécessairement le plus pertinent. J’ai fait une demande à AMO pour qu’il améliore le plugin Simple Tags sur ce sujet et je pense que ce sera très bénéfique pour le positionnement de nos sites dans les moteurs de recherche.

Tags : , , , ,
Trackbacks
  • pligg.com dit :

    Découverte intéressante sur le Duplicate Content dans Google | WordPress tuto…

    « A la faveur d’une erreur dans l’emploi de la balise “more” sur un de mes articles WordPress, j’ai fait une découverte intéressante ou plutôt je crois que j’ai obtenu la confirmation de ma théorie sur le Duplicate Content. » A suivre e…

Commentaires
  • bruno bichet dit :

    Plus je réfléchie au tuning SEO et plus je m’abstiens de trop en faire. Je mets surtout l’accent sur les mots-clés dans le titre, j’essaie de limiter des liens da

  • Francis dit :

    « Contrairement à ce que certains continuent de penser », ça c’est pour ma pomme, non ? :mrgreen: Je n’ai pas dit que j’avais raison ou tort, j’ai juste fait des tests pour voir quelles étaient les incidences de certains changements. Histoire de voir. Et de supprimer l’ensemble des archives de l’index de Google a eu comme conséquence de mieux référencer les permaliens. Maintenant si tu me dis que c’est un + d’avoir les catégories (pas les tags en ce qui me concerne) d’indexées, je ne dis pas non. Faut encore que je vois comment gérer ça avec wpSEO qui ne permet pas de gérer différemment les types d’archives… Sauf repasser sous All In One SEO pack… à voir…

    Mais au final, comme on n’est jamais sûr comment Google gère tout ça… Quoi qu’il en soit, ton histoire avec la balise more est très intéressante. A retenir.

  • libretto dit :

    Cette discussion qui s’étale sur nos blogs respectifs et qui se continue de messages en messages me plait beaucoup. C’est effectivement en particulier à toi que je pensais.
    Pour moi c’est définitif : il faut indexer ses pages de catégories et les tags sont aussi un super système pour se positionner sur des requêtes ciblées dans Google.
    Pour ton prochain thème, tu devrais envisager un petit nuage de tags pour te renforcer sur tes thématiques.

  • Francis dit :

    Je l’avais auparavant, et puis je l’ai viré parce que les visiteurs ne les cliquaient jamais, contrairement aux catégories. Du coup, j’ai gardé uniquement les catégories. En tout cas, je te prends au mot et vais modifier le positionnement des catégories et on en reparlera dans quelques semaines, pour voir ce que ça donne ! ;-)

    Bon week-end

  • mitirapa dit :

    Perso ca me fait plus penser a une prime de fraicheur…

    -Une nouvelle url
    -google la place bien des le debut
    -qques temps apres google l’enleve ou la fait placer tres tres bas
    -google la repositionne « normalement » plus tard

    C’est ce qui se passe sur quasi toutes les nouvelles pages crées sur le web..

  • libretto dit :

    @Mitirapa : peut-être. Pour compléter l’expérience je déplace sur le champ la partie répétée de mon article sur le Snippet. On va voir ce que ça change.
    Au moment du changement je suis n°1 et N°13 sur la requête « Snippet Google ».

  • FunZZ dit :

    C’est pourquoi il ne faut pas abuser des tags. De 1 à 3 par billet est suffisant sinon on génère plein de pages identiques.

  • Oliv dit :

    Concernant le duplicate content je suis d’acord qu’il n’y a pas d’interet à ne pas indexer les pages de tags ou des catégories dès lors qu’elles ne sont pas similaires (d’ou l’interet d’avoir un assez grand nombre de catégories afinde « brasser » le tout). En revanche, cela me semble plus nécessaire pour les pages d’archives. En effet, par définition, ces pages d’archives ont beaucoup plus de chances d’être similaires aux pages du blog où sont listés les articles du fait que l’un comme l’autre sont classés par date décroissante.

    Effectivement à chaque fois qu’on ajoute un article, cela décale l’affichage des pages mais arrive toujours un moment (au bout de x articles selon ce que l’on a configuré) où on retrouvera la même disposition que les archives. Archives et pages normales ne seront donc pas toujours identiques mais présenteront un contenu similaire relativement souvent. Ca n’est pas très bon.

Réagissez