Introduction
Le
protocole de recherche
Les critères
de classement
Le classement
des sites de recherche
|
Avant-propos
Dans cette
évaluation, l’expression « moteurs de recherche
» a été remplacée par «
automate
de recherche ». Au début du web, le «
moteur de recherche » correspondait à
un site. Aujourd'hui, ce n’est plus le cas. Un «
moteur de recherche » comme AllTheWeb (Fast
Search)
ou Google, est utilisé par d’autres sites, notamment des
répertoires,
menant
à une confusion. Ainsi, le site de Sympatio-Lycos Canada
est
appelé « moteur de recherche »
alors qu’il utilise la technologie de Fast Search.
D'autres
auteurs ont évalué les sites de recherche. Les
études
seront listées dans la colonne de gauche.
Introduction
Les automates
de recherche, communément appelés moteurs de
recherche,
sont l’entrée des pages web. Ils se divisent en automates
de recherche propriétaires et en automates de recherche
affiliés,
compléments aux répertoires de recherche. Chacun
prétend
à la suprématie. Afin de vérifier leur
prétention,
j’ai divisé l’évaluation en deux parties. La
première
évalue le formulaire de saisie de la requête ; la seconde
le résultat d’une série de questions.
Le formulaire
La grille
d'évaluation des sites de recherche a été
conçue
en fonction d'un site exemplaire pour un francophone. Ce site
doit
permettre à un internaute moyen de trouver facilement le
document
en fonction d'un formulaire de recherche compréhensible et
tenant
compte des particularités d’une page web. Chaque site de
recherche
a été visité afin de retenir ses
particularités
de recherche. L’ensemble de ses particularités
représente
le formulaire idéal.
Le formulaire
idéal doit être la page d’accueil, ne doit pas être
une simple boîte de requête et n’avoir aucune page d’aide
particulière
mais intégrée au formulaire. Ainsi, le langage
d’interrogation,
les champs de recherche et les fonctions doivent se trouver dans le
formulaire
et non dans les pages d’aides que très peu d’internautes
lisent.
Ce parti pris désavantage les sociétés de
recherche
qui ne font aucun effort de vulgarisation à l’aide d’un
formulaire
adapté à une recherche pouvant apportée plus de
pertinence.
Neuf automates
de recherche ont fait l’objet de l’évaluation
représentés
par trente sites de recherche. Les automates de recherche sont
AltaVista,
Inktomi, Excite, Fast Search, Google, Lokace, Northern Light et
Voila.
Ses neuf automates sont présents sur vingt-huit sites :
AltaVista
USA, AltaVista Belgique, AltaVista Canada, AltaVista France, AOL USA,
AOL
Canada, AOL France, Canada.com*, Excite
USA, Excite Canada, Excite
France,
Fast Search, Google, Google en français, HotBot USA, HotBot
France,
Lokace, Lycos USA, Lycos Canada, Lycos France, MSN USA, MSN Canada, MSN
France, NBCi, Northern
Light,
Spray et Voila. De ces 30 sites, Ecila et Webcrawler (Excite) ont
dû être retranché parce que leur pointage
était
trop bas.
Les répertoires
AOL, MSN, NBCi et Spray sont présents en raison de leur
formulaire
développé, et Lycos de son langage de recherche qu’il a
conservé
de son ancienne vie d’automates (à l’exception de Lycos Canada
qui
a repris le langage de Fast Search).
Les répertoires
Yahoo et Nomade n’ont pas été évalués parce
que l’automate partenaire, Google et Inktomi, y sont accessoires.
Parmi
ces sites de recherche, Inktomi est l’automate de recherche le plus
utilisé
principalement par les répertoires.
Le formulaire
en page d’accueil et la langue ont été des
critères
déterminant pour certains sites. Il est évident que
la langue a favorisé les sites nationaux français.
En contrepartie, ce critère a défavorisé des sites
canadiens et internationaux qui n’avaient pas de version en
français.
Le résultat
de recherche
Tous les
classements des sites de recherche sont fondés sur des
requêtes
effectuées sur la page d’accueil considérée de
facto comme la page utilisée par la plupart des
internautes.
Le classement que je vous propose est basé plutôt sur le
formulaire
avancé, mais sans utiliser la recherche en langage
booléen
formel. Les sites évalués sont la famille AltaVista
(Belge, Canada, France et États-Unis), Excite France, la famille
Fast Search (Lycos Canada, Lycos France et AllTheWeb), Google
français,
la famille Inktomi (HotBot - États-Unis et France - et MSN -
Canada,
France et États-Unis), Northern Light et Voila. Au mois de
juin, la famille Google a accueilli le Canada. Google
canadien-français
et Google États-Unis seront ajoutés au courant de
l’automne
2001. Lokace est en mutation. Il prendra sa place
dès
que la transformation sera terminée. La recherche dans les
familles
permet de vérifier si le résultat est le même pour
chaque pays. Si non, on pourra postuler que chaque pays à
sa propre banque de données, indépendante de la banque de
données mère américaine pour la majorité.
Cette
étude sur le classement des automates de recherche a
été
inspirée de deux textes tirés du Excite Data Project
sur le comportement des chercheurs moyens :
.
Amanda
Spink et Jack L. Xu. (Page consultée le 2 février 2001).
«Selected results from a large study of Web searching: the Excite
study » [En ligne]. Information Research, volume 6, no 1,
octobre 2000. http://www.shef.ac.uk/~is/publications/infres/paper90.html
© the authors, 2000.
.
Amanda
Spink, Judy Bateman et Major Bernard. J. Jansen. (Page consultée
le 2 février 2001). « Searching
heterogeneous
collections on the Web: behaviour of Excite users. » [En ligne] inInformation
Research, volume 4, no 2, october 1998. http://www.shef.ac.uk/~is/publications/infres/paper53.html
© the authors, 1998.
- L’étude
du « 19 clics », «Diameter of the World Wide
Web»,
a été mise à contribution :
A. Albert,
H. Jeong, and A.-L. Barabási, (Page consultée le 2
février
2000). «Diameter of the World Wide Web» [En ligne] in Nature,
vol. 401, p. 130-131, 1999. http://www.nd.edu/~networks/Papers/401130A0.pdf
.
Cette
analyse comprend trois parties : le protocole de recherche, les
critères
de classement et le classement des sites de recherches.
Notes
( Retour )
1.Canada.com
et NBCi ont changé d'automate. Ils utilisent maintenant le
métachercheur Dogpile. Ils seront retirés lors de la
prochaine
mise à jour.
2.
Les sites de Excite Canada et France n'existent plus. Excite US
utilise
pour l'instant son automate éponyme et aussi Dogpile.
|
|