![]() |
|
Ce site comporte près de 100 pages de conseils pour la création et le référencement de sites Internet !
|

akurbitz |
Page d'expérimentation 90 |
![]() |
Nous savons que les moteurs de recherche sont capables de repérer l'existence de plusieurs pages identiques sur le Web. Lorsque deux pages ont des contenus trop proches, l'une des deux est éliminée des index. Cette disposition, nommée "Duplicate content detection", permet d'éviter la présence de doublons inutiles dans les résultats de recherche. La page d'expérimentation que vous lisez actuellement est conçue dans le but d'en savoir d'avantage.
But de l'expérimentation
L'existence du phénomène nommé "Duplicate Content Filter " n'est plus guère contestée aujourd'hui.
Plusieurs expérientations ont déjà démontré son existence, les brevets déposés par Google et Yahoo en expliquent le principe et le bon sens suffit à comprendre son utilité.
Toutefois, si nous savons qu'il convient d'éviter les pages ayant des contenus "similaires", nous ignorons aujourd'hui ce qu'il faut entendre précisement par "similaires".
On entend souvent citer la valeur de 70% (des outils tels que Copyscape et Similar Page Checker permettent de comparer 2 pages et d'en établir le coefficient de similitude), mais à notre connaissance, aucune expérimentation n'a permis à ce jour de déterminer le pourcentage exact au-delà duquel Google, Yahoo et MSN considèrent qu'une page est "dupliquée" par rapport à une autre.
L'expérimentation menée à l'aide de la présente page démontre que ces 70% ne correspondent à aucune réalité et que la façon dont les moteurs détectent le Duplicate Content ne peut se résumer à un simple pourcentage de ressemblance.
Méthodologie
La page que vous être en train de lire à été dupliquée à plusieurs reprises à l'intérieur de ce site. Chacune des copies réalisées à été légèrement modifiée de façon à présenter une ressemblance particulière par rapport à la page d'origine.
Page comportant des balises <TITLE> et <DESCRIPTION> identiques à l'originale |
Page comportant des balises <TITLE> et <DESCRIPTION> différentes de l'originale. Le titre sous forme de texte est également différent. |
Le texte ci-dessous subit des variations d'une page à l'autre, afin de générer des différences entre toutes les pages :
Du sexe et de la violence ! Ce sont les ingrédients savoureux de ce palpitant récit qui se déroule au siècle dernier, alors que nous étions tous bien jeunes et que Google n’existait pas.
Chers lecteurs, voici la tragique histoire du :
Docteur Page and Mr. Rank
Trois ans déjà ! Cela faisait à présent trois longues années que le docteur Page travaillait d’arrache-pied sur son site web, enrichissait ses dossiers et sa page de liens, corrigeait des détails infimes sur tel ou tel chapitre et optimisait ses balises meta dans un admirable souci de perfection.
Sa pugnacité avait d’ailleurs porté ses fruits : le site du bon docteur, considéré comme une référence par la communauté mondiale, accumulait les citations et les succès.
Les visiteurs, qui se comptaient chaque jour par milliers, approuvaient évidemment sans réserve le classement exemplaire de ce véritable monument du web dans les résultats des moteurs de recherche.
Ni cette réussite formidable, ni le soleil printanier de cette charmante matinée, ne parvenait pourtant à égayer le taciturne docteur Page. Son bureau perché en haut d’une tour d’où il voyait le monde à l’envers aurait sans doute donné à quiconque l’envie de devenir artiste. Pas à lui ! Comme chaque matin depuis trois ans, les yeux cernés et la moustache humide de café, il marmonnait des paroles indistinctes en consultant ses statistiques.
- Encore 18 nouveaux liens et 57 citations sur les forums, votre succès ne se dément pas ! constata sa jeune et charmante assistante, miss Stevenson.
- Nous n’y sommes pas, bon sang ! Nous n’y sommes pas ! grognait le docteur Page sans lui prêter attention.
- Dieu seul sait où vous voudriez être, Monsieur. Mais avez-vous seulement conscience du nombre de webmasters qui vous envient votre position ?
- Des médiocres ! explosa-t-il soudain, tous des médiocres ! Savent-ils seulement ce que je pourrais faire si seulement je parvenais… J’ai fais un rêve, voyez-vous miss Stevenson ?! J’ai rêvé qu’il était possible de créer deux versions bien distinctes de mon site ! Imaginez une seule seconde que je puisse rédiger mes pages en ne pensant qu’à l’intérêt des lecteurs ! Imaginez que je puisse me moquer totalement de la façon dont les robots des moteurs de recherche indexent mes textes !
- Mais… voyons… c’est impossible, bredouilla miss Stevenson que l’enthousiasme du docteur Page plongeait dans un embarra insidieux. Vous perdriez tous les visiteurs que vous amènent Yahoo et AltaVista ! Cela représente plus d’un tiers de votre public !
- Impossible, dites vous ? Ha, ha, ha, ha… Impossible, en effet ! Hurla le docteur Page dans un rire hystérique. Sauf si je parviens à mettre au point mon nouveau concept ! Je suis convaincu qu’il est possible d’isoler pour de bon toute la partie du site dédiée au référencement, figurez-vous ! Quelle pureté, Seigneur ! Quelle pureté je pourrais atteindre si seulement je pouvais…
Convaincu que le docteur Page finirait par se calmer et par retrouver la raison, miss Stevenson entama une retraite prudente vers son bureau.
- Assurément, docteur, assurément…
Le docteur se replongea lentement dans ses chiffres et miss Stevenson reprit son inventaire des sites critiquant Microsoft. Un nouvel annuaire qui recensait déjà 397 754 sites venait tout juste d’être mis en ligne sur ce thème et réclamait son attention.
![]() |
Le docteur Page et sa charmante assistante, miss Stevenson dans un moment de tendre complicité, peu de temps avant les évènements tragiques que rapporte ce récit. |
Bien loin d’être anecdotique, cette étrange journée marqua le commencement d’une période trouble et teintée d’angoisse dans l’esprit de la jeune assistante. Le docteur Page semblait désormais comme possédé par sa nouvelle obsession. Ses cernes se creusaient chaque matin d’avantage et son agitation allait en grandissant avec la chaleur de l’été naissant. Les tendres intermèdes qu’elle avait coutume de partager avec lui s’espacèrent peu à peu et finirent par appartenir à un passé que ni l’un ni l’autre n’avait l’air de regretter.
Dans le même temps, miss Stevenson commença à noter des changements subtils dans le contenu du site du docteur Page. Cela ne tenait souvent qu’à quelques mots, mais les textes prenaient peu à peu une densité nouvelle, une précision inédite, une clarté et une concision tout à fait inégalées pour ce type de contenu. Auréolé par un éther sublime de beauté et d’équilibre, le site du docteur Page exhalait peu à peu la perfection absolue.
Le flot de visiteur s’intensifia, attirés par cette qualité extraordinaire et guidé par des moteurs de recherche qui assuraient au site une promotion d’un enthousiasme sans précédent.
La joie de miss Stevenson était pourtant troublée par une série de phénomènes étranges dont la fréquence augmentait insidieusement : les mots-clés associés au site perdaient de la cohérence. Ce fut tout d’abord un « Pamela Anderson » qui fit atterrir un internaute dans la rubrique « économie ». On vit ensuite un visiteur propulsé dans l’annuaire des correspondants chinois à la suite d’une recherche sur « minous asiatiques ». Ce matin encore, les expressions « soirée torride » et « bikini » plaçaient obstinément – et contre toute raison - le site du docteur Page en tête des classements.
Elle hésita à aborder ce sujet avec le vieil homme qui manifestait des signes évidents d’agitation et de fatigue nerveuse. Son teint était affreux et son visage, sans cesse agité d’horribles convulsions, devenait lentement méconnaissable. Ses mains, ses tendres mains dont elle connaissait chaque détail sur le bout des doigts, semblaient être devenu autonomes et traçaient dans l’air des figures cabalistiques à grands gestes saccadés.
La jeune secrétaire, bientôt consternée par la tournure incroyable que prenaient les évènements et persuadée que le docteur courrait à sa perte, se résolue pour de bon à percer l’énigme de la situation.
Faisant fi de ses craintes et de sa retenue naturelle, elle profita d’une absence momentanée du docteur pour se dissimuler dans une armoire métallique surplombant son bureau. Calant son admirable visage en face des ouvertures de ventilation, elle était ainsi en position idéale pour espionner la moindre action de son supérieur. Bientôt revenu de ses ablutions, ce dernier remarqua à peine la disparition soudaine de sa secrétaire et se replongea dans son périlleux labeur, transporté d’une impatience malsaine.
Avec une virtuosité saisissante pour un homme de son âge, le docteur Page ouvrait chacune des pages de son site à l’aide du freeware « RelevanceSpirit » et éditait les balises alt et le cœur de chaque texte tout en poussant des cris rauques dont on eut du mal à croire qu’ils émanaient d’un être humain. Le regard horrifié de la jeune femme voyait les pages si parfaites du docteur se métamorphoser en listes de mots clés surchargées à la laideur innommable. Maîtrisant l’insupportable dégoût que cette vision lui évoquait, elle se mordit la lèvre pour ne pas hurler, fermement décidée à découvrir le sombre dessein du professeur.
Celui-ci acheva de dénaturer un dossier entier dans un borborygme bestial et se jeta sur le code php de chaque page pour le parsemer de « USER_AGENT » et de « REFERRER » indicibles. S’en était trop ! Miss Stevenson ne pu retenir plus longtemps le cri de douleur qui lui tenaillait la gorge (qu’elle avait par ailleurs fort belle).
- Assez docteur ! Assez ! Comment pouvez-vous… Comment osez-vous !?!?
Le docteur sembla émerger lentement de la torpeur sordide dans laquelle son horrible forfait l’avait plongé.
- Miss Stevenson, mais… qui… que faites-vous là… comment… pourquoi… où donc… quelle heure est-il ? demanda-t-il.
- Vous n’avez pas le droit ! Votre site appartient à l’humanité, comment avez-vous pu… s’enflamma-t-elle le souffle court et le teint écarlate faisant ressortir ses lèvres flamboyantes et délicates.
- Ha, ha, ha, ha… s’exclama le vieil homme en partant d’un rire sardonique propre à glacer d’effroi le plus robuste des esquimaux, je ne suis plus le docteur Page !!! Oubliez le docteur Page !!! Je suis devenu mister Rank !!! Et je fais du cloaking, ma très chère amie, je fais du cloaking, DU CLOAKING !!!!! Ha, ha, ha, ha, ha... ha… DUUUU CLOOOOAAAAKKKIIIIINNNNNGGGGGG !!!!!!!!
A partir de cette position, le texte qui figurait sur la page originale a été remplacé par un texte différent (celui que vous êtes en train de lire). Le but de ce remplacement et d'obtenir une similarité de 90% entre la présente page et la page originale, tout en conservant approximativement la même taille entre les deux documents.
Le même type de modification a été opéré sur toutes les pages consacrées à cette expérimentation. Et puisqu'il fallait fournir un contenu différent pour chacune d'elles, notre rédacteur en a profité pour nous rédiger des petites histoires qui ajoutent un côté amusant à cette expérimentation.
En dehors de l'histoire du docteur Page qui figure sur l'original, vous pourrez ainsi vous régaler de l'"histoire d'un plagiat" qui figure sur la page d'expérimentation 40 et de l'"audace de notre rédacteur" qui figure sur la page d'expérimentation 60.
Cette verve inextinguible nous a permis de composer des pages qui sont similaires à la page originale tout en étant assez différentes entre elles. Cela pourra nous apporter une richesse intéressante pour l'analyse des résultats dans la mesure ou la similitude entre la page d'expérimentation 80 et la page d'expérimentation 90 (par exemple) est supérieure à 10%.