![]() |
|
|
|
Ce site est en train de mener une expérimentation concernant la gestion du "Duplicate Content" par les moteurs de recherche. Les principes généraux en sont définis sur la première page d'expérimentation. La page que vous êtes en train de lire décrit les résultats de cette expérimentation et sera régulièrement mise à jour en fonction des évolutions constatées. Première expérimentation (21/03/06)Les premières pages d'expérimentation ont été mises en place. Ce première lot comportait la page originale plus 6 copies de cette page dans lesquelles la partie basse du texte avait été modifiée par rapport à l'original. Ces copies ont été baptisées sous la forme "experimentation-duplicate-XX.php" ou XX représente le pourcentage de similarité avec la page originale. Le mot clé "akurbitz", pour lequel aucun moteur ne trouvait de résultat, a été placé en tête de page afin de faciliter les recherches des pages de ce test. Pour tenter un essai qui soit le plus représentatif possible, le texte de la partie basse a été remplacé par des textes d'une longueur à peu prés équivalente à celle de l'original. Tous les textes étaient des originaux qui n'avaient jamais été publiés sur le Web. Les textes de substitution étaient tous différents d'une page à l'autre. Les contenus des balises <TITLE> et <DESCRIPTION> étaient strictement identiques pour toutes les pages. Résultats : Le 27/03/06, "Googlebot - Googlebot/2.1;" a effectué un scan du site mais n'a intégré que la page originale dans son index. Une recherche sur "Duplicate content detection" proposait notre page originale dans ses résultats dès le lendemain (28/03/06). Une nouvelle visite le 06/04/06 suivie d'une visite le 09/04/06 n'ont pas modifié les résultats. Google semblait refuser d'indexer nos duplicatas. On observait d'ailleurs exactement la même chose avec MSN. La structure dans laquelle nous avons intégré ces pages est peut-être responsable de cet état de fait. Voici comment nous avions construit nos liens : page d'index de notre site ---> page d'expérimentation originale ---> page d'expérimentation 90% ---> page d'expérimentation 80% ---> etc.
Cette construction obligeait Google à explorer le site très profondément pour découvrir toutes ces pages. Deuxième expérimentation (10/04/06)
Résultats : GoogleBot est repassé le 11/04/06, le 13/03/06 et le 15/03/06. A partir du 15, l'ensemble des pages étaient indexées. ![]() Une recherche sur "Duplicate content detection " ne trouvait qu'une seule des pages appartenant à nos tests alors que cette expression figure dans le "chapeau" de toutes les pages du test : ![]() Une recherche sur "Duplicate content filter" ramenait 2 résultats, dans lesquels ne figurent pas la page originale (Notez que cette expression figure au début du texte dupliqué à travers toutes les pages du test) : ![]() Les nouveaux passages de GoogleBot le 18/04/06 et le 20/04/06 n'ont pas amené de changement dans ces résultats. _________________________________________________
Ce site comporte près de 100 pages de conseils pour la création et le référencement de sites Internet ! >>>> Découvrir le reste du site <<<< | Le programme RankSpirit | Créer son site Web | Référencement | Aspects Techniques | Humeurs et réflexions | | Annuaire d'annuaires | Les secrets de Google | Downloads | Liens et contacts | |