Pourquoi Google est-il si méchant ?
La défense de l'utilisateur final est le grand cheval de bataille de tous les moteurs de recherche qui se respectent. C'est la seule politique qui garantisse le succès sur le long terme. Les webmasters qui veulent à tout prix promouvoir leurs sites en font parfois les frais.
Dans cette page : Définition de la "Sandbox" - Que faut-il éviter ? - "Sandboxé" ou "blacklisté" ? - Comment savoir si mon site est "sandboxé" ?

Image : Léa Deborde Le bac-à-sable est une "punition" infligée par Google (et seulement ce moteur, semble-t-il), aux sites qui ont usé de techniques "malhonnêtes" pour tenter de gagner des positions dans les résultats des recherches.
Cette "punition" peut s'appliquer à l'ensemble du site et à tous les termes que ces pages contiennent. Elle serait provoquée par des abus en relation avec le pagerank.
Elle peut aussi être strictement spécifique à un mot ou à une expression dont le site a fait une "promotion" un peu trop appuyée (répétition excessive, par exemple). Elle serait alors provoquée par des abus en relation avec la pertinence.
Certains supposent que les sites récents seraient systématiquement placés dans la "sandbox", qui serait ainsi une sorte de purgatoire en attendant que ces sites aient fait leurs preuves. Le nombre de contre-exemples est si nombreux que nous doutons très fortement de cette théorie. Les sites récents et "sur-optimisés" sont sans doute - par contre - plus susceptibles de tomber dans la sandbox.
Quoi qu'il en soit, la conséquence est une reculade brutale de la position du site concerné (voir une disparition totale) dans les résultats de Google. Cet effet peut avoir une durée de 4 à 30 semaines (sans que l'on sache exactement pourquoi) et peut même perdurer davantage si le site concerné continue à user de stratagèmes "interdits".
Chacun a sa théorie sur le sens à donner à ce système de pénalité. On peut supposer qu'il vise à compliquer l'exploration des "limites" de Google. Accepte-t-il 30 ,40, 50 ou 100 répétitions d'un terme avant de faire tomber le couperet ? Seuls des essais successifs pourraient nous l'apprendre !
En jetant votre site dans le bac-à-sable, Google vous empêche de refaire une tentative d'abus (ou plutôt, il vous empêche d'en mesurer les effets) pendant plusieurs semaines. Mais puisque les règles qui régissent les comportements de Google varient régulièrement, il devient impossible de tirer des conclusions fiables sur ce qui est est licite ou illicite à moins d'être prêt à sacrifier plusieurs sites pour de nombreuses semaines.
Une autre explication, plus simple, consiste à penser que Google cherche tout simplement à "dégoûter" les webmasters qui se livrent à des pratiques douteuses. Dépensez votre temps à améliorer la qualité, pas à chercher des combines, est bien le message que nous répètent inlassablement GoogleGuy et son successeur Matt Cutt.
DANS LE DOUTE, ABSTIENS-TOI !!!!!!!
C'est bien la politique à laquelle les webmasters doivent adhérer ! En travaillant (presque) exclusivement sur l'intérêt de votre site pour ses visiteurs, en vous souciant de son confort de navigation, de sa clarté et de sa cohérence, vous rejoindrez les objectifs des moteurs : satisfaire les internautes. Et vous avez toutes les chances d'obtenir une bonne note globale de leur part !
En détail ...
Nous n'avons pas la liste exhaustive des raisons pour lesquelles vous pourriez vous retrouvez dans le bas-à-sable. En voici toute de même quelques-unes qui ont fait leurs preuves :
Répéter un mot ou une expression un trop grand nombre de fois. Quelle que soit la zone (balises "meta", Alt, texte,...) ou la répétition a lieu. Les répétitions à l'intérieur du texte semblent toutefois bien tolérées lorsque le mot ou l'expression sont mélangés à du texte non répétitif (en clair, lorsqu'ils sont utilisés d'une manière normale !)
Faire figurer du texte d'une couleur identique au fond (blanc sur blanc, noir sur noir, etc.). Cette technique est utilisée pour ajouter à la page, du texte non visible par les internautes, mais reconnu par les moteurs. Certains pensent que cette technique n'est pas une cause de bac-à-sable, mais que Google attribue aux expressions une pertinence proportionnelle à leur contraste par rapport au fond. Dans tous les cas : prudence !
Faire une "farm-link" sur son site. Les "farm-links" sont des pages uniquement constituées d'un grand nombre de liens vers d'autres sites qui comportent des pages du même genre. Le but étant d'utiliser d'une manière intensive l'échange de liens pour tenter de gagner du pagerank.
Créer un site avec une énorme quantité de liens pointant vers lui dès sa naissance. Une théorie assez crédible de Benjamin Tolman soutient que Google pénaliserait les sites ayant une "croissance" suspecte. Il est clair que Google doit avoir trouvé une tactique pour décourager la vente et l'achat de "backlinks" (des liens appartenant à un site de pagerank élevé et pointant vers le site à promouvoir). Cette pratique fausse en effet complètement l'esprit du web et nuit à la fiabilité des résultats des recherches.
Mettre en place un Google-bombing au profit de son site. Si votre site est optimisé pour le mot "machin" et que plusieurs centaines de sites pointent vers le votre avec le mot "machin" dans le texte de leurs liens, Google risque de sentir l'arnaque. Les liens qui pointent vers votre site doivent absolument avoir des textes variés. Méfiez-vous donc des référencements automatiques qui vous font courir ce risque.
Faire un site de 1000 pages, dont 999 pages vides et orphelines (ou pleines de textes bidon) qui pointent vers une seule page ayant du contenu. Si vous avez attentivement lu notre page parlant du pagerank, vous comprendrez que ce type de construction peut permettre de gonfler artificiellement le pagerank d'une page. Google, pas si fou, risque de ne pas apprécier la manoeuvre. D'une manière générale, toutes les sortes de pages satellites sont dangereuses.
Avoir des liens qui pointent vers des sites "malhonnêtes". (Dis-moi qui tu fréquentes et je te dirais qui tu es). C'est l'un des côtés un peu "Big Brother" de Google qui se permet de vous juger en fonction de vos liens sortants. Si vous avez une vraie bonne raison de faire figurer ce type de lien, ajoutez l'argument
rel="nofollow" dans vos liens. Pour plus d'information sur ce point, lire notre article sur le "Trustrank"
Pratiquer le cloaking malhonnête ou l'une de ses variantes.
Voici la liste des pratiques officiellement déconseillées par Google :
(texte extrait de la page http://www.google.fr/support/webmasters/bin/answer.py?answer=35769)
Généralités :
|
Conseils précis
Si un site ne répond pas à nos conseils en matière de qualité, son inclusion dans notre index peut-être bloquée . Si vous pensez que votre site ne respecte pas ces conseils, vous pouvez le modifier et le rendre conforme. Ensuite, vous pouvez faire une demande de réintégration . |
Mei Rose Galang a commenté avec détails certaines de ces directives et nous vous invitons à lire ses commentaires sur le site Arkentos.
Le terme de "sandboxage" est généralement utilisé lorsqu'un site semble avoir été pénalisé sur certains termes ou pour certaines de ses pages.
Lorsqu'un site est purement et simplement retiré de l'index et qu'il n'est plus possible de la faire apparaître dans les résultats de recherche (même en faisant une recherche sur son nom de domaine), on parle plutôt de "blacklistage" (mot issu de "black list", qui signifie "liste noire").
Comment savoir si mon site est "sandboxé" ?
Les filtres assimilés à la "sandbox" ont un comportement suffisamment simpliste pour qu'il soit assez facile de les mettre en évidence. Voici plusieurs techniques qui permettent de constater qu'un filtre de pénalisation est en place :
- Faire une recherche avec un accent : si les résultats d'une recherche sur le mot "hûmour" sont différents de ceux de la recherche sur le mot "humour", c'est que certains filtres les ont modifiés.
- Faire une recherche avec allintext : à quelques rares exceptions près, cette recherche devrait donner les mêmes résultats que sans l'attribut allintext. Les différences peuvent être intéressantes à observer. Le texte de votre recherche devient alors : allintext:humour.
- Ajouter une vingtaine de "-asdf" dans la requête : le texte de votre recherche sera dans ce cas : humour -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf.
- Comparer vos résultats Google et MSN : si vous êtes en première position sur MSN et sur la 50ème page des résultats de Google, il vous est permis de vous demander pourquoi. Cela dit, les deux moteurs utilisent des algorithmes assez différents pour expliquer certains cas de ce type sans recourir à la théorie de la "sandbox".
- Faire des recherches sur des expression composées: si vous êtes premier sur l'expression "de l'humour" et absent des résultats pour le mot "humour" (ou vice versa), c'est sans doute qu'un filtre est en jeu.
Conclusion
Si vous êtes convaincu qu'on ne peut pas réussir en étant honnête et que les méchants triomphent toujours, prenez encore le temps de lire notre page sur le référencement et la morale.
L'article de 7-Dragons sur ce thème
ainsi qu'une interview de Yannick Bouvard qui évoque longuement ce sujet
Vous pouvez recopier gratuitement le contenu de cette page sur votre site en respectant quelques conditions de bon sens.
Consultez notre page "Reprendre nos articles sur votre site".



Les secrets de Google