DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2005-02-15

La logique de Google

La logique de Google -- Depuis quelques semaines, M. Jean Véronis publie des analyses sur le comportement de la recherche booléenne de Google.
Web: Google perd la boole, Web: Comptes bidons chez Google ? et Web: Le mystère des pages manquantes de Google résolu ?
Les commentaires sont aussi intéressants que les articles. Cependant, il me semble qu'il manque un élément dans ces analyses. Google affiche des pages dont les termes de recherche sont absents. Il laisse passer plusieurs pages ayant une indexation vicieuse (lire : Hidden Text in Websites sur le texte caché). D'autres sont des pages citées par d'autres. Google les identifie en cache par cette note « Ces termes apparaissent uniquement dans les liens pointant sur cette page ». Ainsi certaines pages sont comptées en double - la page citée et la page citante. Par conséquent, il y a plus de notices sur Google que sur Yahoo pour une même requête dans l'hypothèse que Yahoo! n'affiche que les pages contenant les termes et seulement ces termes et qu'il maîtrise mieux le blocage des pages viciées.

posté par Marc Duval, #référence - 14:59


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.