DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2003-09-29



Statistiques d'août: MSN.ca toujours en tête
Les statistiques de fréquentation des sites canadiens français de mois d'août n'ont pas révélé de fluctuation notable.  Les sites de recherche sont demeurés stables.  MSN tient toujours ses 2 millions, suivi de Sympatico, Google, La Toile du Québec, Yahoo et GlobeTrotter.  Seul Yahoo! se démarque avec une progression de 10%, le ramenant à son état du printemps.
Source: Infopresse

posté par Marc Duval, #référence - 23:00



Les Cyberbibliothécaires à votre service
Un nouveau site a été ouvert le 23 septembre: les Cyberbibliothécaires.  Il s'agit du volet éducatif de l'usage d'Internet pour les jeunes du réseau Éducation-médias.  Il comprend deux parties.  La première est destinée aux bibliothécaires et la seconde au public.
La partie professionnelle comprend trois documents: Gérer Internet à la bibliothèque, Trousse de communication et de promotion et Ateliers La Toile et les jeunes pour les bibliothécaires. La seconde partie a six documents dont Recherche et authentification de l'information dans Internet.
Cependant, certaines informations ne sont pas à jour entre autres celles de la page Comment chercher dans Internet de façon efficace ? Avant de commencer... concernant les opérateurs booléens.  «La plupart des moteurs de recherche (parfois même ceux dont l'interface a été traduite) utilise la forme anglaise : AND, OR et AND NOT », est-il écrit.  En fait, l'opérateur SAUF se traduit par AND NOT (AltaVista), - (Google) et ANDNOT AlltheWeb).

posté par Marc Duval, #référence - 22:45



Bibliothèque et Google Answers
Une étude empirique a été menée par des bibliothécaires de l'Université Cornell.  L'étude intitulée Google meets eBay compare les réponses de 24 questions de leur service de référence à celui de  Google Answers.  La conclusion est intéressante: le service de référence offert par les bibliothécaires et par Google Answers est équivalent avec un léger avantage en faveur des bibliothécaires.  Ce léger avantage devient appréciable en sachant qu'il est gratuit.
Des bibliothèques publiques offrent ce service par formulaire web et par courriel, en plus du service téléphonique.  Par exemple, celui du Regroupement des centres régionaux des services bibliothèques publiques se nomme Info-Biblio.  La bibliothèque de l'École polytechnique de Montréal a un formulaire de référence sur son site web pour sa clientèle.  Aux États-Unis, des bibliothèques ont des services de références non seulement par formulaire web, mais aussi par clavardage.

posté par Marc Duval, #référence - 12:35

2003-09-25



Google: mise à jour de la barre d'outils en français
La barre d'outils de Google en français est sortie aujourd'hui.  Elle intègre deux nouveautés de la version en anglais: le blocage des fenêtres «pop-up» et la limitation à la recherche d'un pays.
Le 24 septembre, l'Espagne et la Suède ont rejoint la famille de Google.
Le 22 septembre, Google s'est mis à la «géorecherche».  En faisant une recherche sur le sujet, une coïncidence s'est révélé.  En 2002, Google lançait un concours dont le gagnant avait imaginé un méthode de «géorecherche».  C'est ce projet qui est dans le laboratoire d'essai de Google.  La même année, le site Lasoo disparaissait.   Google aurait été le concurrent direct de Lasoo.  Aujourd'hui, Google n'a plus de concurrents dans cette niche.  D'autres sociétés ont une «géorecherche», mais pas sous cette forme.
A lire:
Dany Sullivan. Lasoo Makes Geosearching Visual.  Search Engin Watch, 4 juin 2001.
Geosearch Wins Google Contest, GIS Lounge, 3 juin 2002

posté par Marc Duval, #référence - 21:35

2003-09-23



Google Search by location
Google vient d'ouvrir un autre service dans son labo appelé Google Search by location.  Ce service est destiné à la localisation de commerces aux Etats-Unis.  Ce service n'est pas une innovation.  Northern Light l'avait déjà et couvrait tout le web, et non seulement les États-Unis.

posté par Marc Duval, #référence - 07:23

2003-09-19



Les maths de Google
Google a ajouté une page donnant le mode d'emploi de sa calculatrice.  Il a mis en connaissance de cause un mode d'emploi incomplet.  Ce qui permettra à des férus de math de le compléter sur le web.  Par conséquent, cela donnera à Google de la publicité gratuite et fera vendre quelques livres de plus sur le sujet.  Google a le secret des secrets.

posté par Marc Duval, #référence - 06:50

2003-09-18



WebFountain arrive
IBM et Dow Jones/Reuters mettront en ligne sur le site Factiva la technologie de recherche WebFountain développée aux laboratoires  des recherches d'IBM à Almaden, États-Unis.  Factiva est un service d'abonnement à des bases de données d'affaires.   Selon l'article publié sur CRN, WebFountain extrairait des noms propres - personnes, entreprises, organismes... - et s'en servirait comme base contextuelle au classement des documents.
L'application grand public pourrait être prometteur.  Sa percée dans ce marché pourrait être freinée si la recherche est tarifée à moins d'amener un nouveau modèle d'affaires.

Étant abonné à Factiva, je pourrai vous faire un suivi sur l'implantation de WebFountain.

Source: Barbara Darrow,  IBM WebFountain surfaces in fee-based search service. CRN, 18 septembre.

Ajout du 19 sept. Article en français: IBM dévoile un nouveau système de recherche et de tri

posté par Marc Duval, #référence - 11:13



Gigablast, mise à jour
Matt Wells a annoncé dans son carnet Rants & Raves une mise à jour plus rapide et l'objectif de 400 millions de pages pour la fin de l'année ou plus tôt.

posté par Marc Duval, #référence - 09:50



Gigablast se lance dans le web sémantique
Matt Wells vient d'annoncer que son automate Gigablast supportera sept balises méta (les « meta tags ») qui sont autant de préfixes de recherche.  Ces balises pourraient être une amorce du web sémantique s'il n'y a pas d'abus.  Ces balises sont:

<meta name="zipcode"        content="87112,87113,87114">
<meta name="city" content="albuquerque, abq, rio rancho">
<meta name="state" content="new mexico">
<meta name="country" content="usa, united states of america">
<meta name="author" content="matt wells">
<meta name="language" content="english">
<meta name="classification" content="products,product">
La première balise, «zipcode», indique que Gigablast s'est orienté à desservir les États-Unis.  Cette zone géographique influence la dernière - la « classification ». Les cinq balises ne causent aucun problème.  C'est la «classification» qui peut faire dévier les bonnes volontés.  Pour qu'elle soit optimale, la recherche par classification doit s'appuyer sur un outil de référence universel sinon régional.  Elle doit être accompagnée d'un commentaire fournissant le titre de cet outil et l'adresse URL.  En Amérique du Nord, cet outil est le Système de classification des industries de l'Amérique du Nord (SCIAN).  Pour la classification non commerciale, il y a deux systèmes de classification reconnus: celle de la Bibliothèque du Congrès et celle de Dewey.  Le répertoire Yahoo en français - ou Yahoo! en anglais - pourrait devenir un outil de classification universel.
Il en est ainsi pour les pays et la langue qui doivent utiliser les codes ISO.   Pour les pays, la norme est ISO 3166; pour la langue la norme est ISO 639.  (Voir aussi le Usuels de SIRIUS : Codes pour la représentation des noms de pays et les Usuels de SIRIUS : Codes pour la représentation des noms de langues).  Voir aussi HTML META, REL and REV Tags et le générateur de «meta tags» de Vancouver Webpages.

Nous avons tous intérêts, y compris les webmestres commerciaux, a utilisé honnêtement des outils communs.

posté par Marc Duval, #référence - 07:44

2003-09-17



Un concours pour Google
Google reprend la formule du concours nommé Google Code Jam 2003.  Cette fois-ci, c'est pour résoudre un problème lié à la gestion de plus de 3 milliards d'adresses, si ce n'est de plus de 5 milliards.  Malgré ses ressources humaines comprenant plus de 60 docteurs en technologie de l'information, Google a besoin de faire appel à des informaticiens externes.  Quelle ironie!
L'enregistrement commencera le 1er octobre et se terminera le 15 octobre.  Le concours comprendra quatre tours: la qualification qui retiendra 500 participants.  Ces 500 participants compétitionnenont dans le 1er tour.  250 y seront éliminés.  L'autre moitié entrera dans le 2ème tour.  Vingt-cinq d'entre eux auront à concourir pour les 4 places donnant droit aux lauriers.  Les prix sont: 10,000$US pour la première place, 5,000$US pour la deuxième, 3,500$US pour la troisième et 1,250$US pour la quatrième place.  Tous les autres finalistes recevront 250$US.
Google a vraiment le chic de se faire du capital de sympathie.  Si ce concours est pour dépanner Google, les prix sont dérisoires.
Merci à Allergic pour nous avoir signalé ce concours.

posté par Marc Duval, #référence - 20:47



Google fait chercher Froogle
Après avoir modifié Froogle, Google le met plus accessible.  Une nouvelle case dans le formulaire de recherche de Google destinée à Froogle est apparue furtivement.  Froogle a déjà un formulaire de recherche qui lui est propre.  Faut-il croire qu'il n'est pas suffisant.  Google aurait avantage à ajouter un onglet à sa page d'accueil, si ce n'est davantage.  Après tout, Google est devenu un portail de recherche sans se l'avouer avec sa douzaine de services.

posté par Marc Duval, #référence - 20:44

2003-09-16



Yahoo: 5 nouveaux sites de recherche
Cinq sites de recherche sont entrés dans le répertoire Yahoo! : ChoiceX, MERLOT, Nutch, Sootle et UniXL.
ChoiceX est un répertoire britannique.  Il couvre l'Australie, le Canada, la Nouvelle-Zélande, la Grande-Bretagne et les États-Unis.  Il a intégré un système de notations qui devient une tendance.
MERLOT ou Multimedia Educational Resource for Learning and Online Teaching et UniXL sont des répertoires destinés à la gent universitaire.  MERLOT comprend 7 rubriques: Arts, Affaires, Education, Humanités, Mathématiques, Science et technique et Sciences sociales.  UniXL liste 12 rubriques:  Affaires et économie, Ingénierie, Sciences de la santé, Humanités, Technologie de l'information, Droit, Sciences de la vie, Mathématiques, Sciences moléculaires, Répertoires, Collèges et Universités, Développement régional.
 Sootle est un nouvel automate qui comprend 10,043,214 documents.  Il a un formulaire de recherche qui n'était pas disponible au moment de la consultation du site.  Le robot se nomme Sootlebot.  Il a une page de soumission.
Enfin, Nutch est l'automate à code source ouvert.  Son introduction est prématurée; il n'est pas encore opérationnel.

posté par Marc Duval, #référence - 23:15


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.