DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2003-10-13



Un bracelet pour Google
Un internaute prénommé Seth Finkelstien a relevé une anomalie chez Google en lisant une liste du résultat du jeu appelé GoogleWhack.  Ce jeu consiste à appareiller deux mots afin d'obtenir le plus petit score en termes de pages indexées par Google.  Il a remarqué que le duo «keybord bracelet»  donnait environ 47 000 adresses URL mais Google n'en affichait moins d'une douzaine (aujourd'hui le nombre à augmenter).  Après quelques essais d'interrogation, il en est venu à la conclusion que Google bloquait une adresse. Ce faisant, il bloquait toutes les autres.  En retirant les sites «.com», le résultat de recherche était déverrouillé.
Le  phénomène n'est pas unique aux recherches en anglais.  La requête «vacances ext:ppt» donne le même résultat pour une recherche en français.  Dans la recherche francophone, la liste s'arrête à la 253e adresse (ou environ) sur 475.  Dans la recherche au Canada, la liste s'arrête à 55e URL et en France à la 149e URL sur 221.  Rare sont les internautes qui se rendent jusque là.  Mais certaines requêtes plus anodines pourraient avoir une liste tronquée au début comme dans l'exemple du bracelet.
La question que l'on peut se poser est: En bloquant des URLs, est-ce que Google endigue des pages potentiellement pertinentes?

posté par Marc Duval, #référence - 16:44


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.