DSI. Le carnet des sites de recherche
par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec
Index abrégé du site de DSI :
Les actualités des sites de recherche
Les fiches techniques: AlltheWeb,
AltaVista,
AntiSearch,
Google,
HotBot,
MSN Search,
Northern Light,
Voila - Tout le web francophone
/ Chronique de la recherche
/ Classement des automates de recherche
/ Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
| Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche
|
[Archives] / [Atom] / [RSS]
2003-08-12
Nutch, l'automate open source
Nutch est une organisation sans but lucratif établie en Californie. Elle est la réponse à la commercialisation des résultats de recherche et à la concentration des automates de recherche aux mains des trois principaux joueurs: Yahoo!, Google et MSN.
Elle a pour objectif de bâtir un automate de recherche pouvant aller chercher plusieurs milliards de pages par mois, de maintenir à jour un index de ses pages, d'avoir un vitesse de recherche jusqu'à 1000 fois par seconde, de fournir des résultats de recherche très de haute qualité et enfin de le faire fonctionner à un coût minimal.
Le nouvel automate qui vient de voir le jour est sous les auspices du code source ouvert. Il a pris le nom de sa fondation: Nutch. Un logiciel ayant son code source libre met son développement aux mains de la
communauté des programmeurs dans un but non lucratif. L'arrivée d'un automate à code ouvert est la réplique aux secrets entourant les algorithmes de classement. La société Google est principalement visée pour ses mésaventures concernant son système de classement PageRank.
Selon le fondateur Doug Cutting, le nom Nutch signifierait la bouillie pour les nouveaux-nés. Une fois lancé, les «géniteurs» de Nutch espèrent qu'il suivra les traces de Linux.
Le projet est appuyé par Mitch Kapor de Lotus Development, de la Electronic Frontier Foundation et fondateur-président de l'Open Source Applications Foundation, Tim O'Reilly de O'Reilly and Associates, Peter Savich (Overture Research), Raymie Stata (UCSC), Doug Cutting, fondateur et chef de projet de Nutch et Brewster Kahle, l'homme derrière Internet Archive.
La présence des robots de Nutch a été signalé par plusieurs webmestres en 2002. Le lancement de la version d'essai est prévu pour cet automne avec 100 millions de pages.
Source: John Battelle, Watch out, Google, Business 2.0, août 2003 (abonnement requis)
Autre: Nutch : un moteur de recherche open source sponsorisé par... Overture , 01Net, 14 août 2003
posté par Marc Duval, #référence - 16:32
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un
ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.