![]() |
|
Ce site comporte près de 100 pages de conseils pour la création et le référencement de sites Internet !
|

akurbitz |
Page d'expérimentation 60 |
![]() |
Nous savons que les moteurs de recherche sont capables de repérer l'existence de plusieurs pages identiques sur le Web. Lorsque deux pages ont des contenus trop proches, l'une des deux est éliminée des index. Cette disposition, nommée "Duplicate content detection", permet d'éviter la présence de doublons inutiles dans les résultats de recherche. La page d'expérimentation que vous lisez actuellement est conçue dans le but d'en savoir d'avantage.
But de l'expérimentation
L'existence du phénomène nommé "Duplicate Content Filter " n'est plus guère contestée aujourd'hui.
Plusieurs expérientations ont déjà démontré son existence, les brevets déposés par Google et Yahoo en expliquent le principe et le bon sens suffit à comprendre son utilité.
Toutefois, si nous savons qu'il convient d'éviter les pages ayant des contenus "similaires", nous ignorons aujourd'hui ce qu'il faut entendre précisement par "similaires".
On entend souvent citer la valeur de 70% (des outils tels que Copyscape et Similar Page Checker permettent de comparer 2 pages et d'en établir le coefficient de similitude), mais à notre connaissance, aucune expérimentation n'a permis à ce jour de déterminer le pourcentage exact au-delà duquel Google, Yahoo et MSN considèrent qu'une page est "dupliquée" par rapport à une autre.
L'expérimentation menée à l'aide de la présente page démontre que ces 70% ne correspondent à aucune réalité et que la façon dont les moteurs détectent le Duplicate Content ne peut se résumer à un simple pourcentage de ressemblance.
Méthodologie
La page que vous être en train de lire à été dupliquée à plusieurs reprises à l'intérieur de ce site. Chacune des copies réalisées à été légèrement modifiée de façon à présenter une ressemblance particulière par rapport à la page d'origine.
Page comportant des balises <TITLE> et <DESCRIPTION> identiques à l'originale |
Page comportant des balises <TITLE> et <DESCRIPTION> différentes de l'originale. Le titre sous forme de texte est également différent. |
Le texte ci-dessous subit des variations d'une page à l'autre, afin de générer des différences entre toutes les pages :
Du sexe et de la violence ! Ce sont les ingrédients savoureux de ce palpitant récit qui se déroule au siècle dernier, alors que nous étions tous bien jeunes et que Google n’existait pas.
Chers lecteurs, voici la tragique histoire du :
Docteur Page and Mr. Rank
Trois ans déjà ! Cela faisait à présent trois longues années que le docteur Page travaillait d’arrache-pied sur son site web, enrichissait ses dossiers et sa page de liens, corrigeait des détails infimes sur tel ou tel chapitre et optimisait ses balises meta dans un admirable souci de perfection.
Sa pugnacité avait d’ailleurs porté ses fruits : le site du bon docteur, considéré comme une référence par la communauté mondiale, accumulait les citations et les succès.
Les visiteurs, qui se comptaient chaque jour par milliers, approuvaient évidemment sans réserve le classement exemplaire de ce véritable monument du web dans les résultats des moteurs de recherche.
Ni cette réussite formidable, ni le soleil printanier de cette charmante matinée, ne parvenait pourtant à égayer le taciturne docteur Page. Son bureau perché en haut d’une tour d’où il voyait le monde à l’envers aurait sans doute donné à quiconque l’envie de devenir artiste. Pas à lui ! Comme chaque matin depuis trois ans, les yeux cernés et la moustache humide de café, il marmonnait des paroles indistinctes en consultant ses statistiques.
- Encore 18 nouveaux liens et 57 citations sur les forums, votre succès ne se dément pas ! constata sa jeune et charmante assistante, miss Stevenson.
- Nous n’y sommes pas, bon sang ! Nous n’y sommes pas ! grognait le docteur Page sans lui prêter attention.
- Dieu seul sait où vous voudriez être, Monsieur. Mais avez-vous seulement conscience du nombre de webmasters qui vous envient votre position ?
- Des médiocres ! explosa-t-il soudain, tous des médiocres ! Savent-ils seulement ce que je pourrais faire si seulement je parvenais… J’ai fais un rêve, voyez-vous miss Stevenson ?! J’ai rêvé qu’il était possible de créer deux versions bien distinctes de mon site ! Imaginez une seule seconde que je puisse rédiger mes pages en ne pensant qu’à l’intérêt des lecteurs ! Imaginez que je puisse me moquer totalement de la façon dont les robots des moteurs de recherche indexent mes textes !
- Mais… voyons… c’est impossible, bredouilla miss Stevenson que l’enthousiasme du docteur Page plongeait dans un embarra insidieux. Vous perdriez tous les visiteurs que vous amènent Yahoo et AltaVista ! Cela représente plus d’un tiers de votre public !
- Impossible, dites vous ? Ha, ha, ha, ha… Impossible, en effet ! Hurla le docteur Page dans un rire hystérique. Sauf si je parviens à mettre au point mon nouveau concept ! Je suis convaincu qu’il est possible d’isoler pour de bon toute la partie du site dédiée au référencement, figurez-vous ! Quelle pureté, Seigneur ! Quelle pureté je pourrais atteindre si seulement je pouvais…
Convaincu que le docteur Page finirait par se calmer et par retrouver la raison, miss Stevenson entama une retraite prudente vers son bureau.
- Assurément, docteur, assurément…
Le docteur se replongea lentement dans ses chiffres et miss Stevenson reprit son inventaire des sites critiquant Microsoft. Un nouvel annuaire qui recensait déjà 397 754 sites venait tout juste d’être mis en ligne sur ce thème et réclamait son attention.
Bien loin d’être anecdotique, cette étrange journée marqua le commencement d’une période trouble et teintée d’angoisse dans l’esprit de la jeune assistante. Le docteur Page semblait désormais comme possédé par sa nouvelle obsession. Ses cernes se creusaient chaque matin d’avantage et son agitation allait en grandissant avec la chaleur de l’été naissant.
Ceux qui souhaitent lire la suite de cette histoire peuvent consulter la page originale de cette série concernant nos expérimentations sur la gestion du "duplicate content" par les moteurs de recherche.
Si la fin de ce récit ne figure pas sur la présente page, c'est justement parce que nous avons souhaité la modifier par rapport à l'originale en introduisant des variations dans la partie basse des pages dupliquées. Le texte que vous êtes en train de lire ne figure pas sur la page originale. Mais la présente page est-elle pour autant une page originale aux yeux de Google ? C'est pour répondre à cette trépidante question que nous tentons cette expérimentation.
Si votre seul intérêt est de découvrir les oeuvres étranges de notre rédacteur (ce qui ne serait pas étonnant, compte tenu de son talent exceptionnel), vous serez probablement curieux ou curieuse de lire la réaction de notre champion aux accusations de plagiat qui ont suivi la parution de l'histoire figurant sur notre page originale. Cette réaction est publiée dans son intégralité (toute censure a été exclue) sur la page duplicate 40.
Nous ne saurions trop vous encourager à découvrir l'injustice révoltante dont notre modeste rédacteur à fait les frais et la façon courageuse dont il a décidé de rétablir la vérité en se lançant, seul, dans une entreprise des plus périlleuses.
L'audace de cet homme est d'ailleurs proprement stupéfiante. L'autre jour, alors que nous cheminions de concert en direction d'un bar de renom, il me fit une démonstration brillante de la vaillance et de la grandeur de son âme de poète. Alors qu'un badaud vulgaire s'était mis en tête de s'adresser à son auguste personne dans le seul but dégradant et futile de lui demander l'heure, notre rédacteur lui lança un "il est neuf heure et demi" qui résonne encore dans mon oreille de toute la force de sa pureté sagace.
J'ose espérer que votre intelligence est suffisante pour comprendre que notre rédacteur ne s'était pas contenté de la réponse affligeante de banalité que la sobriété de sa réponse pourrait laisser entendre. Certes, il était effectivement neuf heure et demie, mais vous appréhenderez sans doute qu'au fond, cela n'avait et n'a toujours pas la moindre importance ! (d'autant qu'il n'est probablement pas neuf heure et demi au moment où vous lisez ces lignes).
Ce qui m'a éblouit - allons, soyons directs et méprisons l'élégance forcée qui paralyse trop souvent les propos de la bourgeoisie respectueuse - ce qui m'a mis sur le cul, c'est la certitude immédiate et indubitable que notre rédacteur formulait une phrase d'une profondeur insensée qui se déguisait astucieusement sous la simplicité trompeuse de sa formulation.
Car, disons-le, avouons-le et cessons de nous laisser berner par l'évidence aveuglante des quelques syllabes que comportaient sa phrase : le temps est un concept théorique complexe et subtil que la simplicité ne peut emprisonner. Qui peut emprisonner l'infini ? Et quel concept qui se voudrait profond pourra jamais égaler la merveilleuse et mouvante fluidité d'une vérité du genre "il est neuf heure et demi". Prononcez ces mots à dix heures et vous affirmez un mensonge ! Cela ne vous frappe-t-il pas ?
Je devine le scepticisme et l'incompréhension qui frappe les plus faibles des esprits ayant le bonheur de suivre cette réflexion : "et alors ?" s'interrogent-ils sottement.
Ha, ha, ha ! Et alors, Mesdames les blondes et messieurs les belges, et alors nous venons de mettre le doigt sur le même point vertigineux que notre rédacteur avait effleuré sans faire le plus insigne effort pour que le monde s'apperçoive de la profondeur de son point de vue !
Il n'était pas neuf heure et demie sur l'ensemble de la planète !
Et je sais que les plus imbéciles de nos lecteurs haussent déjà les épaules chargées de leur bêtise en s'exclamant "S'il a fait preuve d'intelligence en prononçant ces mots, je suis moi aussi intelligent à chaque fois que je donne l'heure à quelqu'un !"
J'ose espérer que l'inculture qui s'associe souvent à la bêtise ne vous a pas permis d'ignorer qu'un artiste génial du nom de Duchamp exposa en 1917 un simple urinoir en porcelaine blanche et décréta qu'il s'agissait là d'une oeuvre d'art.
Les spécialistes de l'art considère désormais cette performance comme l'acte artistique le plus innovant et le plus influent de toute la période du 20ème siècle. Il ne s'agit pourtant que d'un urinoir industriel d'un modèle très commun à l'époque ou il fut exposé. Qu'est-ce qui rend cet objet si important d'un point de vue artistique ? Le simple fait que Monsieur Duchamp ait décrété qu'il s'agissait d'une oeuvre d'art !
Par son action, Marcel Duchamp portait un regard novateur sur un objet usuel et nous invitait à faire de même. C'est la profondeur et l'originalité de son regard qui constituent l'oeuvre d'art et non pas la chose qui eu l'insigne honneur d'être l'objet de ce regard.
Je devine qu'enfin, la lumière de ce discours commence à poindre dans les esprits les moins rétifs d'entre vous. Elle se fraie, avec courage, un chemin sinueux jusqu'au coeur de vos petits esprits, contournant les glaires de vos principes et transperçant les miasmes de vos certitudes rabougries.
Certe oui, vous commencez à comprendre que ce qui fit le génie de notre rédacteur ne réside pas dans l'usualité de ses propos, mais dans la pensée consistante et profonde que la richesse inouïe de son esprit divin portait sur le sens impalpable de ses paroles anodines. Et je ne suis pas peu fier d'avoir percé à jour l'immensité de son génie et d'avoir chevauché à ses côtés sur les chemins glorieux et vertigineux que sa générosité m'avait ouvert.
Je vois qu'il n'est pas utile de vouloir vous en dire d'avantage. Il vous est sans doute nécessaire de prendre un peu de repos.
Je vous souhaite le bonsoir.
Note : les faits rapportés dans ces propos sont absolument véridiques. N'ayant toutefois pas le talent, par moi-même, de les mettre en forme afin de faciliter leur compréhension à l'engeance délicate que représente notre lectorat habituel, j'ai confié ce travail à notre rédacteur qui n'a pas son pareil pour ce genre de tache. Sa verve étant sans limite, il est probable que les lignes que vous venez de lire, et qui résultent de ce travail, soient légèrement empruntes d'un romantisme charmant que mon oeuvre originale ne comportait pas.
Le rédacteur en Chef.