Service de recherche documentaire
DSI
 
par Marc Duval, bibliothécaire

Classement
des automates de recherche
Introduction

Mise à jour: 2001-09-20


 Introduction

Les répertoires

 Les noms de domaines

Classement des sites de recherche
 La nature du web

Les automates

Les bases de données

 Actualités
 Le mot-clé

 Le langage de recherche
 Formulaire de recherche web
 Les brèves
 Le web universitaire
 Partie 1
 Les départements
 Le web universitaire
 Partie 2
 Les bibliothèques
 Le palmarès des villes :
 un exemple de recherche
 Accueil



 
 

  • Introduction
  • Le protocole de recherche
  • Les critères de classement
  • Le classement des sites de recherche
  •  

    Autres classements
    Find Everything Faster
    PCWorld, 2001-27-25

    Avant-propos

    Dans cette évaluation, l’expression « moteurs de recherche » a été remplacée par « automate de recherche ».  Au début du web, le « moteur de recherche » correspondait à un site.  Aujourd'hui, ce n’est plus le cas.  Un « moteur de recherche » comme AllTheWeb (Fast Search) ou Google, est utilisé par d’autres sites, notamment des répertoires, menant à une confusion.  Ainsi, le site de Sympatio-Lycos Canada est appelé « moteur de recherche » alors qu’il utilise la technologie de Fast Search. 
    D'autres auteurs ont évalué les sites de recherche.  Les études seront listées dans la colonne de gauche. 

    Introduction

    Les automates de recherche, communément appelés moteurs de recherche,  sont l’entrée des pages web.  Ils se divisent en automates de recherche propriétaires et en automates de recherche affiliés, compléments aux répertoires de recherche.  Chacun prétend à la suprématie.  Afin de vérifier leur prétention, j’ai divisé l’évaluation en deux parties.  La première évalue le formulaire de saisie de la requête ; la seconde le résultat d’une série de questions. 

    Le formulaire

    La grille d'évaluation des sites de recherche a été conçue en fonction d'un site exemplaire pour un francophone.  Ce site doit permettre à un internaute moyen de trouver facilement le document en fonction d'un formulaire de recherche compréhensible et tenant compte des particularités d’une page web.  Chaque site de recherche a été visité afin de retenir ses particularités de recherche.  L’ensemble de ses particularités représente le formulaire idéal. 
    Le formulaire idéal doit être la page d’accueil, ne doit pas être une simple boîte de requête et n’avoir aucune page d’aide particulière mais intégrée au formulaire. Ainsi, le langage d’interrogation, les champs de recherche et les fonctions doivent se trouver dans le formulaire et non dans les pages d’aides que très peu d’internautes lisent.  Ce parti pris désavantage les sociétés de recherche qui ne font aucun effort de vulgarisation à l’aide d’un formulaire adapté à une recherche pouvant apportée plus de pertinence. 
    Neuf automates de recherche ont fait l’objet de l’évaluation représentés par trente sites de recherche. Les automates de recherche sont AltaVista, Inktomi, Excite, Fast Search, Google, Lokace, Northern Light et Voila.   Ses neuf automates sont présents sur vingt-huit sites : AltaVista USA, AltaVista Belgique, AltaVista Canada, AltaVista France, AOL USA, AOL Canada, AOL France, Canada.com*, Excite USA, Excite Canada, Excite France, Fast Search, Google, Google en français, HotBot USA, HotBot France, Lokace, Lycos USA, Lycos Canada, Lycos France, MSN USA, MSN Canada, MSN France, NBCi, Northern Light, Spray et Voila.  De ces 30 sites, Ecila et Webcrawler (Excite) ont dû être retranché parce que leur pointage était trop bas. 
    Les répertoires AOL, MSN, NBCi et Spray sont présents en raison de leur formulaire développé, et Lycos de son langage de recherche qu’il a conservé de son ancienne vie d’automates (à l’exception de Lycos Canada qui a repris le langage de Fast Search). 
    Les répertoires Yahoo et Nomade n’ont pas été évalués parce que l’automate partenaire, Google et Inktomi, y sont accessoires. 
    Parmi ces sites de recherche, Inktomi est l’automate de recherche le plus utilisé principalement par les répertoires. 
    Le formulaire en page d’accueil et la langue ont été des critères déterminant pour certains sites.  Il est évident que la langue a favorisé les sites nationaux français.  En contrepartie, ce critère a défavorisé des sites canadiens et internationaux qui n’avaient pas de version en français. 

    Le résultat de recherche

    Tous les classements des sites de recherche sont fondés sur des requêtes effectuées sur la page d’accueil considérée de facto comme la page utilisée par la plupart des internautes.   Le classement que je vous propose est basé plutôt sur le formulaire avancé, mais sans utiliser la recherche en langage booléen formel.  Les sites évalués sont la famille AltaVista (Belge, Canada, France et États-Unis), Excite France, la famille Fast Search (Lycos Canada, Lycos France et AllTheWeb), Google français, la famille Inktomi (HotBot - États-Unis et France - et MSN - Canada, France et États-Unis), Northern Light et Voila.  Au mois de juin, la famille Google a accueilli le Canada.  Google canadien-français et Google États-Unis seront ajoutés au courant de l’automne 2001.  Lokace est en mutation.  Il prendra sa place dès que la transformation sera terminée. La recherche dans les familles permet de vérifier si le résultat est le même pour chaque pays.  Si non, on pourra postuler que chaque pays à sa propre banque de données, indépendante de la banque de données mère américaine pour la majorité. 
    Cette étude sur le classement des automates de recherche a été inspirée de deux textes tirés du Excite Data Project sur le comportement des chercheurs moyens : 

    .
    Amanda Spink et Jack L. Xu. (Page consultée le 2 février 2001). «Selected results from a large study of Web searching: the Excite study » [En ligne]. Information Research, volume 6, no 1, octobre 2000. http://www.shef.ac.uk/~is/publications/infres/paper90.html   © the authors, 2000. 

    .
    Amanda Spink, Judy Bateman et Major Bernard. J. Jansen. (Page consultée le 2 février 2001). « Searching heterogeneous collections on the Web: behaviour of Excite users. » [En ligne] inInformation Research, volume 4, no 2, october 1998. http://www.shef.ac.uk/~is/publications/infres/paper53.html  © the authors, 1998.
    L’étude du « 19 clics », «Diameter of the World Wide Web», a été mise à contribution : 
    A. Albert, H. Jeong, and A.-L. Barabási, (Page consultée le 2 février 2000). «Diameter of the World Wide Web» [En ligne] in Nature, vol. 401, p. 130-131, 1999. http://www.nd.edu/~networks/Papers/401130A0.pdf
    .
    Cette analyse comprend trois parties : le protocole de recherche, les critères de classement et le classement des sites de recherches.



    Notes  ( Retour )
    1.Canada.com et NBCi ont changé d'automate.  Ils utilisent maintenant le métachercheur Dogpile. Ils seront retirés lors de la prochaine mise à jour.
    2. Les sites de Excite Canada et France n'existent plus.  Excite US utilise pour l'instant son automate éponyme et aussi Dogpile.





     
    Page
    1
    2
    3
    4
    5
    6
    7
    8







    Service de recherche documentaire DSI. 1280-4, boulevard de Montarville. Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: marcduval@dsi-info.ca
    Adresse de cette page : Marc Duval. (Page créée le 28 juillet 2001).  « Classement des automates de recherche ». [En ligne]. Longueuil. Québec, ©2001. http://www.dsi-info.ca/moteurs-de-recherche/classement-introduction.html
    Cette page a été éditée le 30 juillet 2001. 
    ©2001. Marc Duval.


    Hit-Parade
    Mots clés : Bibliothèques (vedettes matières) : recherche sur Internet -- évaluation ;  recherche de l'information ; recherche documentaire ; ouvrages de références -- évaluation ; ouvrages de références -- classement ; gestion de l'information  / Nomade : recherche sur le Web / ODP : recherche sur le Net / Toile du Québec : gestion de l'information ;  Internet - Guides ; guides perfectionnement à la recherche / Voila : internet - recherche d'info sur le web / Yahoo : recherche sur le Net ; recherche sur le Web ; moteurs de recherche ; recherche et traitement de l'information ; internet - information et documentation / Pages jaunes : renseignements-service Longueuil