Introduction
Le
protocole de recherche
Les critères
de classement
Le classement
des sites de recherche
|
Avant-propos
Dans cette
évaluation, l’expression « moteurs de recherche
» a été remplacée par « automate
de recherche ». Au début du web, le «
moteur de recherche » correspondait à
un site. Aujourd'hui, ce n’est plus le cas. Un «
moteur de recherche » comme AllTheWeb (Fast Search)
ou Google, est utilisé par d’autres sites, notamment des répertoires,
menant
à une confusion. Ainsi, le site de Sympatio-Lycos Canada est
appelé « moteur de recherche »
alors qu’il utilise la technologie de Fast Search.
D'autres
auteurs ont évalué les sites de recherche. Les études
seront listées dans la colonne de gauche.
Introduction
Les automates
de recherche, communément appelés moteurs de recherche,
sont l’entrée des pages web. Ils se divisent en automates
de recherche propriétaires et en automates de recherche affiliés,
compléments aux répertoires de recherche. Chacun prétend
à la suprématie. Afin de vérifier leur prétention,
j’ai divisé l’évaluation en deux parties. La première
évalue le formulaire de saisie de la requête ; la seconde
le résultat d’une série de questions.
Le formulaire
La grille
d'évaluation des sites de recherche a été conçue
en fonction d'un site exemplaire pour un francophone. Ce site doit
permettre à un internaute moyen de trouver facilement le document
en fonction d'un formulaire de recherche compréhensible et tenant
compte des particularités d’une page web. Chaque site de recherche
a été visité afin de retenir ses particularités
de recherche. L’ensemble de ses particularités représente
le formulaire idéal.
Le formulaire
idéal doit être la page d’accueil, ne doit pas être
une simple boîte de requête et n’avoir aucune page d’aide particulière
mais intégrée au formulaire. Ainsi, le langage d’interrogation,
les champs de recherche et les fonctions doivent se trouver dans le formulaire
et non dans les pages d’aides que très peu d’internautes lisent.
Ce parti pris désavantage les sociétés de recherche
qui ne font aucun effort de vulgarisation à l’aide d’un formulaire
adapté à une recherche pouvant apportée plus de pertinence.
Neuf automates
de recherche ont fait l’objet de l’évaluation représentés
par trente sites de recherche. Les automates de recherche sont AltaVista,
Inktomi, Excite, Fast Search, Google, Lokace, Northern Light et Voila.
Ses neuf automates sont présents sur vingt-huit sites : AltaVista
USA, AltaVista Belgique, AltaVista Canada, AltaVista France, AOL USA, AOL
Canada, AOL France, Canada.com*, Excite
USA, Excite Canada, Excite France,
Fast Search, Google, Google en français, HotBot USA, HotBot France,
Lokace, Lycos USA, Lycos Canada, Lycos France, MSN USA, MSN Canada, MSN
France, NBCi, Northern Light,
Spray et Voila. De ces 30 sites, Ecila et Webcrawler (Excite) ont
dû être retranché parce que leur pointage était
trop bas.
Les répertoires
AOL, MSN, NBCi et Spray sont présents en raison de leur formulaire
développé, et Lycos de son langage de recherche qu’il a conservé
de son ancienne vie d’automates (à l’exception de Lycos Canada qui
a repris le langage de Fast Search).
Les répertoires
Yahoo et Nomade n’ont pas été évalués parce
que l’automate partenaire, Google et Inktomi, y sont accessoires.
Parmi
ces sites de recherche, Inktomi est l’automate de recherche le plus utilisé
principalement par les répertoires.
Le formulaire
en page d’accueil et la langue ont été des critères
déterminant pour certains sites. Il est évident que
la langue a favorisé les sites nationaux français.
En contrepartie, ce critère a défavorisé des sites
canadiens et internationaux qui n’avaient pas de version en français.
Le résultat
de recherche
Tous les
classements des sites de recherche sont fondés sur des requêtes
effectuées sur la page d’accueil considérée de
facto comme la page utilisée par la plupart des internautes.
Le classement que je vous propose est basé plutôt sur le formulaire
avancé, mais sans utiliser la recherche en langage booléen
formel. Les sites évalués sont la famille AltaVista
(Belge, Canada, France et États-Unis), Excite France, la famille
Fast Search (Lycos Canada, Lycos France et AllTheWeb), Google français,
la famille Inktomi (HotBot - États-Unis et France - et MSN - Canada,
France et États-Unis), Northern Light et Voila. Au mois de
juin, la famille Google a accueilli le Canada. Google canadien-français
et Google États-Unis seront ajoutés au courant de l’automne
2001. Lokace est en mutation. Il prendra sa place dès
que la transformation sera terminée. La recherche dans les familles
permet de vérifier si le résultat est le même pour
chaque pays. Si non, on pourra postuler que chaque pays à
sa propre banque de données, indépendante de la banque de
données mère américaine pour la majorité.
Cette
étude sur le classement des automates de recherche a été
inspirée de deux textes tirés du Excite Data Project
sur le comportement des chercheurs moyens :
.
Amanda
Spink et Jack L. Xu. (Page consultée le 2 février 2001).
«Selected results from a large study of Web searching: the Excite
study » [En ligne]. Information Research, volume 6, no 1,
octobre 2000. http://www.shef.ac.uk/~is/publications/infres/paper90.html
© the authors, 2000.
.
Amanda
Spink, Judy Bateman et Major Bernard. J. Jansen. (Page consultée
le 2 février 2001). « Searching heterogeneous
collections on the Web: behaviour of Excite users. » [En ligne] inInformation
Research, volume 4, no 2, october 1998. http://www.shef.ac.uk/~is/publications/infres/paper53.html
© the authors, 1998.
-
L’étude
du « 19 clics », «Diameter of the World Wide Web»,
a été mise à contribution :
A. Albert,
H. Jeong, and A.-L. Barabási, (Page consultée le 2 février
2000). «Diameter of the World Wide Web» [En ligne] in Nature,
vol. 401, p. 130-131, 1999. http://www.nd.edu/~networks/Papers/401130A0.pdf
.
Cette
analyse comprend trois parties : le protocole de recherche, les critères
de classement et le classement des sites de recherches.
Notes
( Retour )
1.Canada.com
et NBCi ont changé d'automate. Ils utilisent maintenant le
métachercheur Dogpile. Ils seront retirés lors de la prochaine
mise à jour.
2.
Les sites de Excite Canada et France n'existent plus. Excite US utilise
pour l'instant son automate éponyme et aussi Dogpile.
|
|