L’interview de Matt Cutts par Stephan Spencer
J’ai déjà évoqué cette interview dans cet article sur le Duplicate Content mais comme elle a duré plus d’une demi heure, de nombreux autres sujets ont été abordés et méritent d’être relevés.
Plutôt que de traduire littéralement 12 pages de discussions à bâton rompu, je vais me contenter de survoler et de résumer les principaux points relevés lors de cet échange.
Sur les résultats supplémentaires.
Google ne communique plus là dessus parce que ce n’est plus important. Auparavant les résultats supplémentaires n’étaient interrogés par les algorithmes de Google que pour certaines requêtes compliquées. Maintenant ces résultat sont systématiquement interrogés (où en passe de l’être).
Sur les sites en Flash.
Google ne peut pas transcrire les fichiers Flash en texte. Par contre avec l’outil SDK de Macromedia Adobe on peut transmettre du texte aux moteurs de recherche. C’est sur cette voie que Google est en train de travailler.
Sur les liens obtenus sur des sites de Social Bookmarking.
Stephan se demande si ce genre de liens, plus facile à obtenir, ne seraient pas traités de manière différente par Google.
Réponse : non la politique de base de Google est qu’un lien est un lien. Les liens issus du social Bookmarking ne pèsent pas moins que les autres.
D’ailleurs, les liens obtenus sur des domaines .edu ou .gov ne comptent pas en eux-mêmes plus que les autres. Il n’y a qu’a voir le nombre de site avec le mot Viagra qui sont des .edu. Les .edu et .gov ont généralement tendance à être de meilleure qualité mais il vaut mieux un bon lien venant d’un site .com qu’un mauvais lien venant d’un site .edu.
Sur les page doorway et les sitemap.
Question : comme Google précise ce qu’est une page Doorway (dans les Guidelines) n’y a-t-il pas de risque que des pages de site map mal codées puissent être considérées comme des pages doorway ?
Réponse : c’est quelque chose où nous faisons très attention parce qu’il arrive que certains fassent un site map à partir de tous les liens cliquables de leur site (We try to be savvy).
Sur les URLs bourrées de mot clefs.
4 ou 5 mots c’est tout à fait normal mais plus cela abouti à ce que notre algorithme accorde moins de poids à ces mot clefs. Si on met 15 mots clefs dans une URL, on peut être signalé par un rapport de spam et alors quelqu’un va venir voir ce qui se passe et cela peut-être considéré comme du spam.
Le conseil de Cutts et de ne pas mettre des tonnes de mots clefs dans l’URL et de ne mettre là que des informations utiles pour les utilisateurs.
Sur l’évolution des moteurs de recherche vers plus d’interventions humaines.
A la base Google ce sont des algorithmes et c’est comme ça que Google s’est développé depuis le début. Cela reste vrai mais un traitement humain a été ajouté pour traiter les spammeurs signalés.
Matt Cutts pense que des projets comme Wikia (un genre de DMOZ ?) est intéressant. Google est ouvert sur des idées d’utilisation de classement faits par des humains. C’est l’idéal pour éliminer les sites des spammeurs.
Bug dans les « Nofollow ».
Le tag rel= »nofollow » permet à Google de ne pas transmettre du PageRank vers le site lié. Cependant certains ont remarqués que l’anchor texte du lien pouvait être associé par Google au site lié. C’est un bug qui a été corrigé. Les liens en Nofollow ne sont pas non plus utilisé pour la découverte du Web par Google.
Sur les achats de liens pour pénaliser un concurrent.
Question : certains sites imaginent d’acheter des liens vers leurs concurrents et ensuite ils envisagent de dénoncer leurs concurrents pour les pénaliser dans Google.
Réponse : Je ne pense pas que des concurrent intelligents puissent essayer cela. Il y a des chances pour que ça leur fasse plus de mal que de bien (more likely to help ?).
Nous faisons très attention, dans toutes nos techniques contre les spammeurs, à ce qu’un site ne puisse saboter un autre site.
Sur le Tag Robot= »nocontent » introduit par Yahoo.
Pour l’instant il n’y a que 500 sites qui utilisent cette balise. Google ne compte pas prendre en compte cette balise dans ces conditions.
Sur la limite des 100 liens par page.
C’est conseillé de ne pas les dépasser mais maintenant que Google indexe plusieurs méga par page ce n’est plus une limite « dure ». Il est toujours préférable de créer plusieurs pages avec moins de liens qu’une page avec plus de 100 liens.
Peut-on s’attendre à ce que les pénalités en Page Rank soient expliquées dans la console WebMaster central ?
Pourquoi pas.
C’est déjà en place pour les sites infectés par des malware.
Pour quelqu’un qui a déjà fait la preuve de ses intentions malhonnête il n’est pas question de le prévenir à chaque foi qu’il franchit la ligne jaune. Par contre pour un site de papa / maman il y a plus de chances pour qu’on essaie de leur faire passer le message que leur site est infesté.
Mon petit commentaire
Voilà ce que je retiens particulièrement de cet entretien et ce que j’en pense.
- dans ma page sur le référencement d’un lien profond, j’avais exposé le tactique du Social Bookmarking pour améliorer le classement d’une page particulière. Pour moi Matt Cutts valide cette technique.
- Je retiens qu’il ne faut pas mettre plus de 4 ou 5 mots clefs dans une URL. A la base j’en ai déjà 2 (WordPress et tuto) mais j’espère que c’est dans le titre (balise Title) de la page qu’il ne faut pas utiliser plus de 5 mots. L’affaire n’est pas très claire…
- Sur l’évolution des moteurs de recherche. Je suis très content de ce qu’énonce Matt Cutts sur les humains. Je ne vois pas trop bien ce que peut apporter Wikia mais DMOZ, dont je suis éditeur, a un slogan qui colle parfaitement à ce que recherche Matt Cutts : « human do it better », ce qu’on pourrait traduire en « faites confiance aux humains ». Pour DMOZ, il s’agit bien d’utiliser des êtres humains pour séparer les sites spammy des sites intéressants (n’en déplaisent à certains…).
Tags : Google, référencement SEO, social-bookmarking

Merci, très intéressant !
geol
Très bon travail de traduction et de synthèse.
Je repars de ton site avec une « to do list » intéressante, merci!
Article super intéressant, merci moi, je repart avec une « not to do list », lool
Très bon travail de traduction et de synthèse.