Google 007

Google ToolBar : l'espion qui m'aimait

Dans sa course effrénée à la performance, Google use de toutes les possibilités pour améliorer ses résultats de recherche. Connaître nos moindres faits et gestes sur la toile fait évidemment partie des voies explorées.

A lire en complément de cet article : fonctionnement GoogleGoogle, comment ça marche ?

En bref ...

Réfléchissez à ce qui se passe lorsque vous naviguez à travers le web et que votre poste est équipé d'une GoogleBar.

A chaque fois que vous arrivez sur une nouvelle page, votre barre Google vous indique le PageRank de cette page. Pour obtenir cette information, la Google ToolBar a du envoyer une requête à l'un des datacenter de Google. Cette requête contient au minimum :
IP du posteL'I.P. de votre poste (sa signature électronique) ce qui permet de savoir dans quel pays vous résidez.
Adresse de la pageL'adresse de la page que vous visitez.

Le datacenter interrogé n'a plus qu'à constituer une base de données de toutes les requêtes, en y ajoutant les dates et les heures de chacune d'elles pour connaître :
préférencesvos sites préférés,
durée des visitesle temps que vous passez sur chaque page,
navigationvotre parcours à l'intérieur de chaque site, votre parcours de site en site,
adéquation des résultats proposésvotre utilisation des résultats proposés par Google ou par d'autres moteurs de recherche : cliquez-vous toujours sur le premier site proposé ? Combien de sites proposés explorez-vous suite à une recherche ?
Qualité des lienssuivez-vous les liens proposés par les sites que vous visitez ? Lesquels ?

Ces renseignements extraordinaires permettent à Google de connaître très précisément vos préférences et vos habitudes de navigation. Nul doute qu'ils font désormais partie des indices permettant de classer les sites dans les résultats des recherches.


En détail ...

L'arme fatale

Google n'est pas le seul !

Google n'est pas le seul à vouloir utiliser une toolbar ou la liste des favoris pour en tirer des informations :

Alexa est un système comparable à la Google ToolBar qui vous propose de découvrir les sites les plus visités en mettant à votre disposition les résultats retournés par son système.

Human Links, Pandango et Pointera sont des systèmes de recherche basés sur les favoris et les historiques de navigation de leurs utilisateurs. Ces systèmes reprennent le principe de "peer-to-peer" et tentent de l'adapter à la recherche d'information. Ces tentatives qui datent toutes les trois de 2001 ne semblent toutefois pas avoir rencontré un succès foudroyant.

Bien qu'aucune statistique officielle n'ait été publiée sur ce point, on estime que plusieurs dizaines de millions d'Internautes ont installé la Google ToolBar sur leurs postes. Google est donc désormais en mesure de connaître les habitudes de navigation d'une immense proportion des utilisateurs du web. Cet échantillon est largement suffisant pour se faire une idée très précise des sites qui sont appréciés ou boudés par les internautes.

Cette source d'information présente au moins deux avantages inédits par rapport aux autres sources dont peut disposer Google :
On ne triche pasElle est infalsifiable : aucun webmaster, aussi futé soit-il, ne peut truquer la fréquentation réelle de son site.
Qualité des liensElle indique le parcours des internautes et le temps passé sur chaque site.

Cette arme fatale permet, entre autres choses, de vérifier la qualité des résultats fournis par ce moteur de recherche et d'identifier à coup sûr les "spammeurs".

Voici quelques exemples d'applications possibles :

Estimer la qualité d'un site

Un moyen simple consiste à regarder combien de temps vous restez sur ce site, combien de pages du site vous consultez et combien de liens proposés par le site vous suivez. A titre d'exemple, une page à laquelle les internautes consacrent en moyenne 5 secondes et qu'ils quittent sans suivre les liens qu'elle propose est probablement une page qui les a déçus.

Vérifier la qualité des résultats de Google

Multiplier les sources d'information

Les lettres d'amour que vous envoyez à amant/maîtresse en utilisant GMail n'intéressent probablement pas Google. La messagerie de ce moteur contient néanmoins des renseignements très précieux :
QuiDe quels sites parlez-vous dans vos mails ?
vocabulaire utiliséQuels mots-clés associez-vous à ces sites ?

Le brevet Google de décembre 2003 évoque également la possibilité d'explorer les favoris et les cookies des internautes pour connaître leurs sites préférés et habituels. Nul ne sait si Google a mis cette idée en pratique, mais ce brevet démontre que le Roi des moteurs de recherche n'entend pas laisser quoi que ce soit au hasard !

Il suffit de comparer l'ordre des sites proposés par Google avec l'ordre des "qualités" estimées au point précédent. Il est aussi très intéressant de regarder quels sites vous choisissez dans la liste que vous propose Google et combien de temps vous passez sur ces sites. On peut supposer que si vous quittez ces sites au bout de quelques secondes, c'est que vous les estimez "non-pertinents" par rapport à votre recherche.

Identifier les "spammeurs"

Regardons les fréquentations des sites qui occupent souvent la première place des résultats. Si cette fréquentation est très rapide (l'internaute ne reste que quelques secondes sur le site), alors que ces sites sont censés être de bonne qualité, il y a de forte chance pour qu'il s'agisse de "spammeurs" qui ont gagné leurs premières places de façon "malhonnête".

 

En conclusion ...

L'objectif de cet article n'est pas de "dénoncer" la collecte d'information réalisée par la Google ToolBar. A notre sens, La relation entre un numéro d'I.P. et l'adresse d'une page ne mérite pas la qualification "d'information personnelle". Si cette relation vous gène, un simple firewall suffit à protéger votre "anonymat" (sans gêner pour autant le fonctionnement de la Google ToolBar).

Notre objectif était de démontrer que les systèmes traditionnels de notation des sites (Pagerank, TrustRank,...) sont sans doute devenus - ou vont rapidement devenir - très accessoires dans le classement des résultats de Google. Les infos issues de la Google ToolBar sont bien plus sûres et plus précises que ces anciens systèmes de notation.

Cette avancée devrait permettre une nette amélioration des résultats délivrés par Google et les spammeurs de tous poils ont sans doute beaucoup de soucis à se faire pour les années à venir. Qui s'en plaindra ? (à par eux !)



L'annuaire du webmaster Le design des sites Web


L'encyclopédie du Monde Apprendre les CSS en douceur


Vous pouvez recopier gratuitement le contenu de cette page sur votre site en respectant quelques conditions de bon sens.
Consultez notre page "Reprendre nos articles sur votre site".


Valid HTML 4.01 Transitional   Vérifier l'orthographe avec RankSpirit et "Le Patron"   Indice YooVi


Wikibis : le savoir à portée de clic.