Conseils de Lorelle sur le Duplicate Content

Voici donc un article de Lorelle sur le Duplicate Content, il date un peu (juillet 2007) mais comme il est en phase avec mes préoccupations du moment, je crois qu’il mérite une petite traduction.

Si vous vous demandez ce que c’est que le Duplicate Content, je vous renvoie à ma traduction de la prose de Google sur ce sujet.

Donc, après avoir attiré l’attention sur un article de Ozh qui explique qu’il est intéressant de n’afficher que des excerpts (résumé) de ses articles dans ses pages d’archives pour contourner le filtre de Duplicate Content, voilà ce que dit Lorelle :

… En réalité, Google s’attend à ce qu’il y ait du Duplicate Content sur un blog. C’est intrinsèque à leur conception. Le contenu dupliqué sera trouvé sur la page d’accueil, les pages des catégories et des tags, les résultats des recherches, les flux et beaucoup d’endroits de votre blog. C’est attendu. S’il n’en était pas ainsi, vous ne seriez pas sur un blog.

Alors que l’aide d’Ozh est super pour réduire le contenu dupliqué sur votre blog en utilisant des résumés des articles au lieu des articles complets sur les pages qui affichent plusieurs pages, n’oublions pas que cette pénalisation de page rank (ndt : le filtre de Duplicate Content n’a pas grand chose à voir avec le Page Rank page rank est ici à comprendre dans le sens de « résultats des recherches ») est destinée contre ceux qui détourne votre contenu ou contre les splogs (de Spam et BLOG) qui utilise du contenu dupliqué pour emplir leurs pages et en y ajoutant des liens de spam.

Voici mes conseils pour réduire le risque d’une pénalisation pour Duplicate Content :

  1. Utilisez les excerpts (extraits) pour les affichage de plusieurs articles à la fois. Vous pouvez faire exception si vous le voulez pour la page d’accueil et pour les fluxs (ndt : pour ma part j’utilise toujours une balise more dans mes articles pour obtenir le même type de résultat).
  2. Faites attention, lorsque vous copiez le contenu d’un autre blogueur de vous limiter à 10%du contenu ou 400 mots. Il s’agit de respecter le Copyright Law’s Fair Use restrictions (ndt : jamais entendu parler de cette histoire…). Écrivez avec vos propres mots avant et après ce contenu copié, il s’agit de différencier la copie de l’original.
  3. Ne jamais utiliser un générateur de flux (feed scraper ???) ou un plugin de génération automatique de flux qui remplisse votre site avec des extrait ou des articles complet provenant d’autres sites. Si vous utilisez des flux entrants, limitez les aux titres ou au plus aux 100 premiers mots.

En dehors de cela, détendez-vous. Souvenez-vous que c’est normal d’avoir du contenu dupliqué sur un blog. Par contre, du contenu dupliqué entre blog ne l’est pas et est pénalisé.

Mon commentaire

Je suis globalement d’accord avec ce que Lorelle a écrit mais voici quelques réflexions complémentaires :

  • Pour l’histoire du formatage des flux entrant je ne vois pas vraiment l’intérêt du conseil. Connaissez vous des blogs qui récupèreraient des articles complet d’autres blogs en ayant l’impression que Google va trouver leur contenu intéressant ?
  • Pour l’histoire des 10% ou des 400 mots il me semble que la règle n’a rien à voir avec le Duplicate Content. Jamais Google ne fixe de règle aussi stricte leurs guides sont plus des explications sur leur philosophie de leur démarche que des recettes simplistes.
  • Contrairement à ce que Fran6 disait cet été, ce type de conseil n’empêche pas du tout d’utiliser des plugins de SEO comme All In One SEO Pack. Pour un bon référencement, il faut absolument soigner son titre et ses méta (Keyword et Description) et c’est ce à quoi sert principalement ce plugin.

Tags : , ,
Trackbacks Commentaires
  • Francis dit :

    J’ai dit quoi moi ? ;-) J’utilise WPseo depuis cet été pour travailler un peu plus mes descriptions et les keywords. Je l’utilise aussi pour le fameux duplicate content. Résultat, 20/25% de visites en plus en provenance des moteurs de recherche et 50% de pages indexées en moins grâce au fichier robots.txt qui a aussi son importance…

    A vrai dire, je ne suis toujours pas convaincu de l’importance de toutes ces choses pour un meilleur positionnement comparé aux backlinks… Quoi qu’il en soit, je suis pour éviter les articles complets ailleurs que sur le permalien, ne serait-ce que pour éviter au visiteur de s’y perdre…

    Donc, non, pour moi ces plugins sont importants. Pas primordiaux cela dit…

  • Sylvain dit :

    Article intéressant sur le duplicate content et conseils à priori utiles si les sanctions de Google s’avèrent effectives.
    Ne maitrisant pas les tenants et aboutissants sur le sujet, à la lecture de ta traduction je me pose une question :
    Les sites tels que Mashable et OriginalSignal pour ne citer qu’eux fondent leur existence sur la duplication de contenu. Alors qu’elle avenir offrira Google à ces services qui apparaissent comme très utiles dans le filtrage des informations remontant de la blogosphère ??? (la preuve : j’ai découvert ton blog par blogasty…)

    Merci d’avance pour ta réponse

  • libretto dit :

    @ Fran6: je viens d’aller vérifier une de tes page de catégorie et tu y a collé un méta noindex. A mon avis ce n’est pas judicieux, d’autant que ton thème est bien fait avec des excerpts sur les pages d’archives… moi, mes pages de catégories sont les principales indexées en dehors de la home.
    @Sylvain : tous les outils que tu sites n’apparaissent que très très rarement dans les résultats de Google (en tous cas d’après mon expérience). Ces outils n’ont ni passé ni avenir dans Google. Par contre leur utilité est évidente pour les geeks comme nous…

  • Francis dit :

    Effectivement, j’avais viré une grande partie des pages pour voir la différence, un peu comme un test. Au final, pas de grands changements. Il faudrait que ces pages soient très souvent visitées pour changer la donne, ce qui n’est pas le cas chez moi…

    Mais en ce qui concerne ce point, j’avais lu chez SEObook que le mieux était de concentrer les visites sur les permaliens… Après, tu en aura qui te diront d’avoir un max de pages indexées… Pour quel changement au final ? C’est toujours le même problème avec le SEO… Je reste toujours sur ma réserve quand à leur intérêt malgré le fait d’en avoir parlé positivement cet été. La retour d’expérience m’a appris pas mal de choses…

    a+

  • libretto dit :

    En ce qui me concerne ces pages de catégorie ou de tags sont souvent très bien placées dans Google et sont donc assez souvent cliquées.
    Il y a aussi l’effet nombre de page indexées qui augmente en proportion le nombre de Bls internes et ça ne peut pas faire que du mal non ?
    Sinon c’est malheureux mais avec les indications données par Google on travaille plus avec des supputations et des petites cuisine personnelles qu’avec des certitudes dans cette affaire. C’est peut-être aussi le charme du référencement tout ça.

  • Francis dit :

    Je dirais que c’est un mélange entre la curiosité et la frustration le référencement… :mrgreen:

  • mike dit :

    Si on mets un no index sur les categories et les archives, comment google indexera mes articles une fois qu’ils seront passé dans les archives puisqu’il ne seront plus accessible pour lui?

  • Francis dit :

    mike > tes articles sont toujours accessibles par leur permalien !

  • libretto dit :

    Je suis d’accord avec Francis, une fois indexée les pages ne disparaissent pas de l’index de Google (à ce que je sais en tout cas).
    Par ailleurs on peut toujours accéder aux anciens articles en suivant le lien « article précédent » qui se trouve en bas de la page index.
    Cela di je persiste à dire qu’il ne faut pas affubler ses archives du tag « no index ». Si tu as vraiment peur, essaie plutôt soit de choisir un thème qui utilise les extraits dans les archives soit en utilisant la balise more à bon escient quand tu écris tes articles.

  • Mike dit :

    Ah d’accors (je débute…lol) sinon la fonction more je ne peux pas l’utiliser, c’est un blog de videos que je tiens donc j’ai 2,3 lignes de commentaires par video pas assez pour utilser more

  • yndoula dit :

    Salut!
    Je cherche depuis quelques jours un tuto qui puisse m’aider à réaliser des extraits de 15 à 20 mots avec wordpress.
    Je te remercie d’avance.
    Yndoula

  • sosmedical dit :

    Even for people who work the traditional eight to five job the convenience of shopping online is hard to ignore. Certainly

    there will be times when you feel like doing something else rather than shopping. But then if for some reason you do if you

    like shopping, all you do is walk over to your computer, and log onto your favorite online gift shop, and you can be

    shopping.
    Secondly let’s look at the availability of the number of stores. The Internet makes it possible for you to shop virtually

    anywhere in the world that ships to where you live. If you find that special gift shop online that has what you’re looking

    for you can feel comfortable ordering from them without having to physically visit their store. This is not possible when you

    walk outside and shop because you’re limited in your ability to shop only at stores that are within driving range of your

    front door.

  • sysav dit :

    - Thirdly let’s talk about comparison shopping. You can quickly do comparison shopping on things such as pricing. It will be

    hard to do that when you’re shopping at its traditional retail store. You can also compare various items that you would never

    see in a traditional store. You can look at things like size, color, availability, and these sort of things, to determine if

    you wish to make a purchase that day online or not.

  • terreetfeu dit :

    - Finally let’s talk about shipping your product. There are a variety of shipping methods available to you including express

    shipping. If you’re in a bind and forgot about a special birthday or an anniversary, and need a gift in a hurry, express

    shipping can really bail you out. You can go to your favorite gift shop online, make the purchase, determine how quickly you

    need a product shipped, and pay for it all in a matter of minutes.
    This is 4 benefits I can think of for buying your next guest from a shop on the Internet. Perhaps you can think of others of

    your own.

  • ladydylan dit :

    The Toro power shovel is a great tool for clearing snow off of smaller driveways, porches, decks, stairs and walkways. Because of its size, it is easy to maneuver. Because it is electric, you do not need to bother with gas and oil. It starts up right away despite the cold.
    Because it handles snow up to 6 inches, it is best to keep up with the snow as it falls. Otherwise you will need to clear the snow in layers. Some current owners do this with no difficulties, others say that the machine gets heavy clearing the snow this way. Just like shoveling, you need to keep up with the snow so that you are not dealing with too much at one time. But unlike shoveling, there is no real effort exerted when using the Toro Power shovel.

  • Blowing the snow a distance of 20 feet really clears the area you are working in. Be smart though and watch which way the wind is blowing or you could be blowing the snow right back where you just cleared. Since you cannot control which way this power shovel shoots the snow (it shoots straight ahead of you), you do need to make a plan so that you do not end up throwing snow onto an area you already cleared.
    One huge benefit that comes from using the Toro power shovel is the time that you save. Several people have told me how quickly this works – clearing snow in a fraction of the time it takes to shovel.
    Many owners have been very happy with this little machine, saying it is a great product at a great price. This inexpensive snow blower will do a great job as long as you are not expecting it to do the job of a more powerful walk behind snow blower. This is not an industrial machine, it is a machine meant for the average home owner looking for a quick and easy way to clear the snow by their house.

  • lesmots dit :

    The Graco Duoglider seems to be a legitimate choice when shopping for a two child stroller. It offers many comfort features that children can enjoy, as well as easy to use mechanics and durability for parents. With all of the advantages and good things the stroller has to offer, there are also some hassles to go along with it.
    A good thing about the stroller that many smaller, more petite people may especially enjoy, is its lightweight. It has a weight very comparable to other single child strollers. There are many advantages to this stroller having such a lightweight, easy maneuverability when pushing and easy to lift in and out of vehicles just to name a couple. It is important to be able to have things operating smoothly and as easy as possible when multiple children are involved. The last thing a parent needs is a stroller that is only going to cause more stress and more problems due to a non-user friendly design. That just would not work because the whole idea behind this stroller is to make things easier for the parents, not harder.

  • jean loup dit :

    Le duplicate content nuit à la qualité de votre site. Vous serez pénalisés aussi bien par vos visiteurs que par les moteurs de recherche comme Google si votre site propose du contenu dupliqué. Vos visiteurs préféreront retourner sur un site proposant un contenu unique. De leur côté, les moteurs de recherche, afin de préserver la qualité de leurs résultats, vont pénaliser vos pages en mettant en avant des sites proposant un contenu non dupliqué. Il est donc important dans une stratégie SEO de mettre en place des solutions pour lutter contre le duplicate content.
    http://serrurier-paris-urgent.fr/

    Le contenu dupliqué nuit à la qualité de votre site. Il est donc primordial de mettre en place des solutions pour rendre vos contenus uniques. Voici quelques conseils pour vous aider à lutter contre le content dupliqué :

  • dudi dit :

    5 conseils pour favoriser un contenu unique

    1. Soignez vos balises title et meta description

    La première chose à faire est de définir des balises title et meta description différentes pour chaque page. Si ces balises se répètent alors que le contenu des pages est différent, vos pages seront d’ores et déjà pénalisées par les moteurs de recherche. Par conséquent, prenez un minimum de temps pour les rédiger et ainsi proposer un contenu unique et décrivant le mieux possible le contenu de votre page.

    2. Définissez une URL pour un contenu

    Il est possible de rendre votre contenu accessible par différents chemins. Toutefois, il faut penser à indiquer lequel de ces contenus doit être indexé. Pour cela, vous pouvez utiliser la balise meta robots avec l’attribut rel= »nofollow » pour indiquer au moteur de recherche de ne pas suivre une URL. Ainsi pour un même contenu, l’URL ne possédant pas l’attribut rel= »nofollow » sera privilégiée.

    S’il s’agit d’un contenu qui existait déjà mais que vous souhaitez modifier son URL, pensez à utiliser une redirection 301. Il s’agit d’une redirection permanente : elle permet d’indiquer que le contenu à changer d’adresse. Ainsi si la précédente URL était indexée, votre nouvelle URL pourra être indexée sans être considéré comme du duplicate content.

    3. Indiquez l’URL canonique

    L’en-tête de votre page, la partie , contient de nombre balises. Parmi ces balises, il ne faut pas négliger celle-ci : link rel= »canonical ». Elle permet d’indiquer au moteur de recherche l’adresse du contenu source. Elle vous sera notamment utile face aux agrégateurs de contenu. Ces sites reprennent les articles de différents sites, souvent en totalité, en copiant le code. Grâce à l’url canonique, les moteurs de recherche sauront que votre article contient le contenu d’origine.

    4. Renseignez le fichier Robots.txt http://depannage-plombier-pas-cher.fr/

    Le fichier robots.txt est le premier fichier que les robots des moteurs de recherche consultent lorsqu’ils se rendent sur un site. Ce fichier permet notamment d’indiquer aux moteurs de recherche de ne pas parcourir certaines pages et ainsi de ne pas les indexer. Pour cela, il vous faudra utiliser l’instruction Disallow pour chaque page à exclure.

    Lorsque votre contenu est accessible via plusieurs URLs mais que vous souhaitez en indexer une seule, il est également possible d’utiliser la balise meta robots. Elle permet de définir si la page doit être indexée ou non. Ainsi il faudra jongler entre les valeurs index et noindex pour vous assurer qu’un contenu ne soit indexé qu’une seule fois.

    5. Dernier recours en cas de duplicate content

    Si malgré toutes les précautions prises vous êtes encore confrontés au duplicate content à cause d’un site externe, il vous faudra trouver une solution à l’amiable avec le propriétaire de ce site. Pour cela rendez-vous sur le site qui copie votre contenu et cherchez un moyen de contacter le webmaster. Si vous lui expliquez la situation, vous trouverez surement un arrangement pour qu’il supprime le contenu copié. Si vous n’arrivez pas à vous entendre avec le webmaster du site en question, vous pouvez également demander à Google la suppression d’un contenu dans son moteur de recherche.

  • art dit :

    I got this website from my pal who informed me on the topic of
    this web page and at the moment this time I am visiting this web page
    and reading very informative articles at this time.

Réagissez