SERVICE DE
RECHERCHE
DOCUMENTAIRE
Service de recherche documentaire DSI
par Marc Duval, bibliothécaire

Les brèves

de DSI


 
 
 
 
Septembre 2003 

Accueil DSI
Les brèves de 2001
Les brèves de 2002
Les brèves de 2003


Yahoo/Inktomi sur Dogpile

1er septembre -- InfoSpace a renouvelé son métachercheur Dogpile.  Son renouvellement donne deux résultats différents avec Yahoo et Google.  Or, Yahoo! utilise encore Google sur son site.  Le test a été fait avec le mot «enfiroiper» mis dans la balise Description de quatre pages de mon site.  Le résultat de Yahoo! sur Dogpile concorde avec celui de MSN.

Google à 5 milliard

2 septembre --  Depuis le 30 août, le nombre d'URL du catalogue Web de Google a fait un bond de 2 milliards passant de 3,4 milliards à 5,2 milliards.

Le 7 septembre, Google inc. fêtera son cinquième anniversaire.  Il semblerait bien que la société se prépare à un grand coup.  Déjà, celui-ci dépasse toutes les mises à jour connues.
Note: Après le 7 septembre, le développement de Google s'est arrêté, pire il a régressé.

La logique de Gigablast

3 septembre --  Le 1er septembre, Gigablast a introduit ses opérateurs logiques: OR, AND, AND NOT.  Leur mode d'emploi a été ajouté à sa page d'aide.  A ces trois opérateurs, il en a ajouté un autre qui n'a reçu aucune explication: OR NOT.
Note: Le duo OR NOT a été retiré quelques semaines plus tard.

Google fait des vagues - 3 septembre

En ce début de septembre, Google fait parler de lui.

Commençons avec la perle avocassière.  Le cabinet d'avocats de Kazaa a demandé à Google d'enlever des sites promouvant le téléchargement du logiciel Kazaa lite, la version sans publicité ni de logiciel espion.  La note émanant du cabinet mentionne 15 sites à retirer. Belle publicité pour ces 15 sites.  Nous n'avons plus besoin d'aller sur Google pour les consulter.  D'ailleurs, Google  recense des milliers de sites pouvant télécharger le logiciel sans oublier celui de Branchez-vous!
Source: Branchez-vous!

Du côté commercial, Overture intente une injonction contre le fournisseur d'accès internet allemand T-Online.  T-Online semble avoir retiré cavalièrement les liens commerciaux d'Overture pour les remplacer par ceux de Google sur son portail.  Overture veut faire un exemple de cette affaire.  Les trois coups ont résonné, la farce est commencée.
Source: Le journal du Net

Google fait parler de lui à travers ses concurrents.
Depuis ces dernières années, Google est le préféré de la presse.  Quelques journalistes ont fait valoir qu'il n'y avait pas que Google sur le web.   Le Washington Post a jeté son dévolu sur Dogpile qui vient de faire sa mise à jour, le site TheWBALChannel.com fait appel à InfoPlease, un journaliste de Jakarta Post préfère MSN en conjonction avec Internet Explorer et celui de TechNewsWorld vante Teoma.
Dans l'antre de Google, la société améliore la rapidité de son service de recherche d'images plus particulièrement en se dotant du logiciel NetScaler.  Ce logiciel sert aussi de chien de garde de première ligne pour arrêter toutes intrusions.
Source: ComputerWorld

Plus mondain, les fondateurs Sergey Brin et Larry Page font partie des jeunes gens les plus riches.  Leur cassette contient pas moins de à 900$ millions de dollars chacun.  En comparaison, David Filo et Jerry Yang de Yahoo! sont milliardaires.
Source: Fortune

Enfin, n'oublions pas de souhaiter un bon anniversaire à la société cendrillon qui fêtera ses cinq années de bouleversement du web le 7 septembre en lisant l'article de USA Today paru le 26 août.

Études: Lacunes en recherche chez les étudiants

9 septembre -- Au début du mois d'août, la CREPUQ (Conférence des recteurs et des principaux des universités du Québec) a publié une étude intitulée Étude sur les connaissances en recherche documentaire des étudiants entrant au 1er cycle dans les universités québécoises.  Cette étude est fort instructive.  Voici les constats:

  • Le tiers des répondants ne peuvent identifier les concepts pour élaborer une requête.
  • Le deux tiers des répondants ne savent pas utiliser l'opérateur logique «OU».
  • La moitié des  répondants n'utilise pas l'encyclopédie pour aborder une question.
  • Le cinquième des répondants ne font pas la différence entre un catalogue de bibliothèques et une base de données.
  • La moitié des répondants ne distinguent pas un métachercheur d'un automate de recherche.
  • Les trois-quarts des répondants ne savent pas évaluer la qualité d'un site.
  • Les trois-quarts des répondants ne savent quand il faut citer une document.

    L'étude révèle que plusieurs répondants associent les connaissances informatiques à l'informatique documentaire. «Les étudiants semblent croire que les connaissances en informatique et les connaissances en recherche documentaire font appel aux mêmes habiletés.» (page 66).

Enfin, il y a confusion terminologique entre catalogue de bibliothèque, «moteurs de recherche» et «bases de données [spécialisées]».

Ce qui est troublant dans cette étude est que les auteurs confondent un répertoire comme Yahoo et un «moteur de recherche» en posant ces deux énoncés :  «Pour trouver à l’aide d’un moteur de recherche comme Yahoo des documents sur « L’impact de l’amincissement de la couche d’ozone sur la santé... », j’utilise les mots» (page 38) et «Un moteur de recherche tel Google ou Yahoo, ne permet pas de trouver...» (page 51).  Notez la double confusion, Yahoo utilise Google en complément à son répertoire.  Enfin, Yahoo est nommé «répertoire» une seule fois (page 49) mais absents des énoncés.  Peut-on vraiment s'étonner de la confusion entre les outils de recherche chez les étudiants lorsque les spécialistes sont tout aussi confus?

-------------
Référence du document:
Diane Mittermeyer et Diane Quirion.  Étude sur les connaissances en recherche documentaire des étudiants entrant au 1er cycle dans les universités québécoises.  (Montréal, CREPUQ, 2003).  111 p.

Résumé de l'étude.
Marie-Andrée Chouinard (Page consultée le 9 septembre).  «La bibliothèque pour les nuls»  [En ligne] in  Le Devoir, 9 septembre 2003. http://www.ledevoir.com/2003/09/09/35692.html


Google fête
- 9 septembre

9 septembre -- Google se fête en mettant son logo sur sa page d'accueil.  Et non, ce n'est ni le 7 ni le 8 comme plusieurs sites ont affirmé en s'appuyant sur l'histoire donnée par Google. Il semblerait bien qu'il y ait confusion sur son jour anniversaire même chez Google.  Google se fêterait-il en retard?

Quoi qu'il en soit, l'aventure de ce qui allait devenir Google a commencé avec la rencontre de Larry Page et de Sergey Brin en 1995.  Ils suivaient tous deux un programme post-universitaire en informatique à l'Université de Stanford.  Ils entreprennent de créer un nouvel automate de recherche basée sur les relations entre les hyperliens à partir de vieux PC.  Leur prototype, appelé «BackRub», est créé dans leur chambre d'étudiants qui devient vite petite.   L'Université héberge BackRub et les étudiants le testent.   En 1998, ils lèvent des fonds de près 1 millions de dollars US auprès de la famille, d'amis et de trois investisseurs de Silicon Valley.   En septembre de la même année, ils emménagent dans la maison d'une de leur amie Susan Wojcicki.  Ils louent le garage et peu à peu, ils investissent toute la maison.  «BackRub» est rebaptisé Google, de googol, terme désignant 10 à la puissance 100.  En 1999, devant le succès universitaire et sa fulgurante renommée dans le milieu à travers le web, des capitaux sont injectés par des investisseurs privés.  L'année suivante, les deux larrons contactent un ami pour leur proposer Google.  Cet ami est David Filo, le fondateur de Yahoo!


Pour en savoir plus
Google inc. (Page consultée le 9 septembre). Google History. [En ligne].  2003. http://www.google.com/corporate/history.html
Jefferson Graham.(Page consultée le 9 septembre). The search engine that could [En ligne] USA Today, 26 août
Neil Swidey.(Page consultée le 9 septembre). «A Nation of Voyeurs» [En ligne] Globe Magazine, February 2, 2003.



Wayback Machine recherche plein texte

11 septembre -- Wayback Machine a pour mission d'archiver tous les sites web.  Il est destiné principalement aux universitaires, aux étudiants et aux historiens, plus largement au public.  Ses archives remontent jusqu'en 1996.  Son index comprend plus de 30 milliards de pages avec une taille de 300 téraoctets de données.  En comparaison, Google a 3,3 milliards de pages.

Sa méthode de recherche est basée sur l'URL.  Son formulaire comprend une caractéristique intéressante, soit la conversion des pages en format PDF.

Le 3 septembre, Wayback Machine s'est équipé d'un module de recherche plein texte nommé Recall.  Ce module de recherche en test a été créé bénévolement par Anna Patterson de l'Université de Stanford, pépinière d'informaticiens d'où est issu Google entre autres.

Jusqu'à maintenant, 11 milliards de pages sur 30 milliards ont été indexés.

Ni le module de recherche plein texte Recall ni un hyperlien explicite ne sont sur la page d'accueil.  Il est accessible par l'hyperlien Web du menu et par le logo Wayback Machine à cette adresse: http://www.archive.org/web/web.php.

Le module de recherche plein texte a un formulaire de recherche moins développé que celui par adresse URL.  Il comprend une case de recherche pour la requête et une recherche par intervalles de dates.  La requête par défaut est l'expression par exemple les prénom et  nom d'une personne.  Si le logiciel ne trouve pas l'expression, il isole les mots.  Le classement du résultat de recherche est par pertinence et non par «notoriété».

Le résultat de recherche comprend deux graphiques et une liste de quelques pages.  Il n'y a pas l'option de groupement des pages d'un site.  La page a une colonne à droite qui donne les statistiques sur le nombre de pages qui contient le ou les mots de la requête.  Suivent quatre options de précision de requêtes: listes de termes associés, variantes orthographiques, catégories et sujets.  Les catégories et les sujets ne sont pas encore au point.  A la requête «AlltheWeb», la catégorie «real estate» apparaît.  Parmi les sujets, ce sont «aldult» (sic) et «illinoi» (sic) qui sont affichés.  Ces options sont performantes lorsque les pages ont un seul sujet.   Elles sont appropriées pour des recherches sur une entreprise qui déclinent des catégories de produits.

Bref, le formulaire de recherche est nettement incomplet d'autant qu'il n'y pas de lien pour retourner à l'accueil de Wayback Machine à moins d'utiliser le lien Feedback.

Rappelons qu'Alltheweb s'est associé à Wayback Machine pour l'accès aux archives d'un site.

Enfin, un diaporama est disponible pour en connaître plus sur Recall.

Citation de la semaine: Faire le djihad

14 septembre -- «Les candidats au djihad n'ont pas à s'en faire : Internet se charge de leur trouver des correspondants. Si l'on tape, par exemple, dans le moteur de recherche Google, « Faire le djihad », on reçoit, en vrac, plus de 8 000 réponses.» est-il écrit dans le Figaro Magazine du 6 septembre.

En fait, Google recense environ 54 pages ayant la phrase « "Faire le djihad" ».

Il faut utiliser le formulaire de recherche en inscrivant le groupe de mots dans la case de recherche de l'expression exacte ou mettre le groupe de mots entre guillemets anglais pour trouver une expression.

Web sémantique: journée d'étude

15 septembre -- Le 14 octobre prochain se tiendra une journée d’étude intitulée Le Web sémantique : de nouveaux enjeux documentaires ? à Paris dans le Socle de la Grande Arche de la Défense.  Elle est organisée par l’Association des professionnels de l’information et de la documentation (ADBS) et l’IUT de Paris 5.  Voici un extrait du programme:

«Le web sémantique est un ensemble de concepts et de technologies qu'il importe de s'approprier dès aujourd'hui, d'autant plus que les professionnels de l¹information disposent d¹un ensemble de savoirs et de savoir-faire particulièrement adapté à cette nouvelle étape du web. Ils sont ainsi à même d'être les partenaires de nouvelles collaborations. Rassemblant des spécialistes de l'information, des chercheurs et des industriels, cette journée d¹étude s'adresse à la fois aux professionnels de l'information et aux chercheurs du domaine : au-delà de la nécessaire connaissance des concepts, des solutions déjà opérationnelles et des outils de demain, l'objectif de cette rencontre est d'avancer ensemble dans la réflexion, pour esquisser de nouvelles formes de partenariat. Tel sera l'objet de la table ronde qui clôturera cette journée.»

Renseignements : ADBS, Brigitte Tartavez
25 rue Claude Tillier - 75012 Paris
Tél. 01 43 72 99 80 - Fax 01 43 72 30 41
brigitte.tartavez@adbs.fr


Quand l'info est obsolète

16 septembre -- Quand on consulte un site, même celui de DSI, l'information peut être obsolète.  L'obsolescence d'une information ne signifie pas qu'elle est fausse mais qu'elle n'a pas été mise à jour.  Par exemple, certaines informations de l'étude sur les automates de recherche de DSI de 2001 sont périmées.  Les utiliser pour un article sans indiquer la date pourrait tromper le lecteur. L'article intitulé Optimiser le référencement de votre site et publié le 15 septembre s'appuie sur de l'information dépassée.  Apparemment, le journaliste a consulté le site Abondance et a utilisé de l'information obsolète sans la faire valider.

Voici quatre affirmations qui ne sont plus vraies :

1. «...de nombreux moteurs de recherche utilisent principalement deux balises META: description et keywords (mots clés)».  En fait, aucun des grands automates de recherche n'utilisent la balise «keywords».  En juin, elle avait été testée avec le québécisme «enfiroiper» et seul Inktomi la reconnaissait.  Le même test a été mené au début de septembre et Inktomi ne réagissait plus à la requête à moins que le mot ne soit associé à un autre mot unique à la page ( « enfiroiper saviez-vous » ).  Cela devient une entreprise aléatoire que de s'appuyer sur la balise «keywords» pour optimiser une page.  Il est possible que prochainement Inktomi délaisse complètement cette balise.

Cette caractéristique d'Inktomi pourrait être utilisée à d'autres fins, par exemple comme mot de passe pour accéder à une page web anodine dont l'information à transmettre est insérée dans une balise de commentaire visible dans la source de la page et invisible aux robots et sur la page même.

2. «...en l'absence de balise META description, AltaVista utilise les tout premiers mots de la page lorsqu'il renvoie les résultats d'une recherche...».  AltaVista n'utilise plus ce format d'affichage.  Il a repris le format du mot en contexte (kwic) devenue la norme.

3. «La balise description vous permet de décrire votre page en une ou deux phrases. De nombreux moteurs de recherche utilisent ces informations lorsqu'une liste de résultats de recherche est renvoyée.»  En fait, seul AlltheWeb affiche pleinement la balise description.  AltaVista, Google et Inktomi en affichent une partie sous le format du mot en contexte.

4. «... Excite n'utilise pas la balise META keywords pour indexer les sites. Néanmoins, il utilise la balise META description pour générer le résumé du site.»  Excite n'existe plus en tant qu'automate de recherche.  Il utilise maintenant un métachercheur d'InfoSpace.

Avant d'utiliser de l'information d'un site, il est important de la faire valider par l'auteur du site ou par croisement avec un autre site.  Sinon, il est important de valider soi-même l'information.  L'auteur de l'article aurait pu tester les trois dernières affirmations facilement vérifiables.  Indiquez aussi la référence, la date de consultation et la date de la page pour permettre au lecteur de le mettre en contexte.  Enfin, il faut tenir compte de la forme.  Un carnet web n'est pas exempt d'erreurs.  En général, il est écrit sous une forme éditoriale et il a un caractère officieux.

Yahoo: 5 nouveaux sites de recherche

16 septembre -- Cinq sites de recherche sont entrés dans le répertoire Yahoo! : ChoiceX, MERLOT, Nutch, Sootle et UniXL.

ChoiceX est un répertoire britannique.  Il couvre l'Australie, le Canada, la Nouvelle-Zélande, la Grande-Bretagne et les États-Unis.  Il a intégré un système de notations qui devient une tendance.

MERLOT ou Multimedia Educational Resource for Learning and Online Teaching et UniXL sont des répertoires destinés à la gent universitaire.  MERLOT comprend 7 rubriques: Arts, Affaires, Education, Humanités, Mathématiques, Science et technique et Sciences sociales.  UniXL liste 12 rubriques:  Affaires et économie, Ingénierie, Sciences de la santé, Humanités, Technologie de l'information, Droit, Sciences de la vie, Mathématiques, Sciences moléculaires, Répertoires, Collèges et Universités, Développement régional.

Sootle est un nouvel automate qui comprend 10,043,214 documents.  Il a un formulaire de recherche qui n'était pas disponible au moment de la consultation du site.  Le robot se nomme Sootlebot.  Il a une page de soumission.

Enfin, Nutch est l'automate à code source ouvert.  Son introduction est prématurée; il n'est pas encore opérationnel.

Google fait chercher Froogle

17 septembre -- Après avoir modifié Froogle, Google le met plus accessible.  Une nouvelle case dans le formulaire de recherche de Google destinée à Froogle est apparue furtivement.  Froogle a déjà un formulaire de recherche qui lui est propre.  Faut-il croire qu'il n'est pas suffisant.  Google aurait avantage à ajouter un onglet à sa page d'accueil, si ce n'est davantage.  Après tout, Google est devenu un portail de recherche sans se l'avouer avec sa douzaine de services.

Un concours pour Google - 17 septembre

Google reprend la formule du concours nommé Google Code Jam 2003.  Cette fois-ci, c'est pour résoudre un problème lié à la gestion de plus de 3 milliards d'adresses, si ce n'est de plus de 5 milliards.  Malgré ses ressources humaines comprenant plus de 60 docteurs en technologie de l'information, Google a besoin de faire appel à des informaticiens externes.  Quelle ironie!

L'enregistrement commencera le 1er octobre et se terminera le 15 octobre.  Le concours comprendra quatre tours: la qualification qui retiendra 500 participants.  Ces 500 participants compétitionnenont dans le 1er tour.  250 y seront éliminés.  L'autre moitié entrera dans le 2ème tour.  Vingt-cinq d'entre eux auront à concourir pour les 4 places donnant droit aux lauriers.  Les prix sont: 10,000$US pour la première place, 5,000$US pour la deuxième, 3,500$US pour la troisième et 1,250$US pour la quatrième place.  Tous les autres finalistes recevront 250$US.

Google a vraiment le chic de se faire du capital de sympathie.  Si ce concours est pour dépanner Google, les prix sont dérisoires.

Gigablast se lance dans le web sémantique

18 septembre -- Matt Wells vient d'annoncer que son automate Gigablast supportera sept balises méta (les « meta tags ») qui sont autant de préfixes de recherche.  Ces balises pourraient être une amorce du web sémantique s'il n'y a pas d'abus.  Ces balises sont:

<meta name="zipcode"        content="87112,87113,87114">
<meta name="city" content="albuquerque, abq, rio rancho">
<meta name="state" content="new mexico">
<meta name="country" content="usa, united states of america">
<meta name="author" content="matt wells">
<meta name="language" content="english">
<meta name="classification" content="products,product">

La première balise, «zipcode», indique que Gigablast s'est orienté à desservir les États-Unis.  Cette zone géographique influence la dernière - la « classification ». Les cinq balises ne causent aucun problème.  C'est la «classification» qui peut faire dévier les bonnes volontés.  Pour qu'elle soit optimale, la recherche par classification doit s'appuyer sur un outil de référence universel sinon régional.  Elle doit être accompagnée d'un commentaire fournissant le titre de cet outil et l'adresse URL.  En Amérique du Nord, cet outil est le Système de classification des industries de l'Amérique du Nord (SCIAN).  Pour la classification non commerciale, il y a deux systèmes de classification reconnus: celle de la Bibliothèque du Congrès et celle de Dewey.  Le répertoire Yahoo en français - ou Yahoo! en anglais - pourrait devenir un outil de classification universel.

Il en est ainsi pour les pays et la langue qui doivent utiliser les codes ISO.   Pour les pays, la norme est ISO 3166; pour la langue la norme est ISO 639.  (Voir aussi le Usuels de SIRIUS : Codes pour la représentation des noms de pays et les Usuels de SIRIUS : Codes pour la représentation des noms de langues).  Voir aussi HTML META, REL and REV Tags et le générateur de «meta tags» de Vancouver Webpages.

Nous avons tous intérêt, y compris les webmestres commerciaux, a utilisé honnêtement des outils communs.


Gigablast, mise à jour

Matt Wells a annoncé dans son carnet Rants & Raves une mise à jour plus rapide et l'objectif de 400 millions de pages pour la fin de l'année ou plus tôt.

WebFountain arrive

18 septembre -- IBM et Dow Jones/Reuters mettront en ligne sur le site Factiva la technologie de recherche WebFountain développée aux laboratoires  des recherches d'IBM à Almaden, États-Unis.  Factiva est un service d'abonnement à des bases de données d'affaires.   Selon l'article publié sur CRN, WebFountain extrairait des noms propres - personnes, entreprises, organismes... - et s'en servirait comme base contextuelle au classement des documents.

L'application grand public pourrait être prometteur.  Sa percée dans ce marché pourrait être freinée si la recherche est tarifée à moins d'amener un nouveau modèle d'affaires.

Source: Barbara Darrow,  IBM WebFountain surfaces in fee-based search service. CRN, 18 septembre.
Ajout du 19 sept. Article en français: IBM dévoile un nouveau système de recherche et de tri


Les maths de Google

19 septembre -- Google a ajouté une page donnant le mode d'emploi de sa calculatrice.  Il a mis en connaissance de cause un mode d'emploi incomplet.  Ce qui permettra à des férus de math de le compléter sur le web.  Par conséquent, cela donnera à Google de la publicité gratuite et fera vendre quelques livres de plus sur le sujet.  Google a le secret des secrets.

Google Search by location

23 septembre -- Google vient d'ouvrir un autre service dans son labo appelé Google Search by location.  Ce service est destiné à la localisation de commerces aux Etats-Unis.  Ce service n'est pas une innovation.  Northern Light l'avait déjà et couvrait tout le web, et non seulement les États-Unis.

Google: mise à jour de la barre d'outils en français

25 septembre -- La barre d'outils de Google en français est sortie aujourd'hui.  Elle intègre deux nouveautés de la version en anglais: le blocage des fenêtres «pop-up» et la limitation à la recherche d'un pays.

Le 24 septembre, l'Espagne et la Suède ont rejoint la famille de Google.

Le 22 septembre, Google s'est mis à la «géorecherche».  En faisant une recherche sur le sujet, une coïncidence s'est révélé.  En 2002, Google lançait un concours dont le gagnant avait imaginé un méthode de «géorecherche».  C'est ce projet qui est dans le laboratoire d'essai de Google.  La même année, le site Lasoo disparaissait.   Google aurait été le concurrent direct de Lasoo.  Aujourd'hui, Google n'a plus de concurrents dans cette niche.  D'autres sociétés ont une «géorecherche», mais pas sous cette forme.

A lire:
Dany Sullivan. Lasoo Makes Geosearching Visual.  Search Engin Watch, 4 juin 2001.
Geosearch Wins Google Contest, GIS Lounge, 3 juin 2002


Bibliothèque et Google Answers

29 septembre -- Une étude empirique a été menée par des bibliothécaires de l'Université Cornell.  L'étude intitulée Google meets eBay compare les réponses de 24 questions de leur service de référence à celui de  Google Answers.  La conclusion est intéressante: le service de référence offert par les bibliothécaires et par Google Answers est équivalent avec un léger avantage en faveur des bibliothécaires.  Ce léger avantage devient appréciable en sachant qu'il est gratuit.

Des bibliothèques publiques offrent ce service par formulaire web et par courriel, en plus du service téléphonique.  Par exemple, celui du Regroupement des centres régionaux des services bibliothèques publiques se nomme Info-Biblio.  La bibliothèque de l'École polytechnique de Montréal a un formulaire de référence sur son site web pour sa clientèle.  Aux États-Unis, des bibliothèques ont des services de références non seulement par formulaire web, mais aussi par clavardage.

Les Cyberbibliothécaires à votre service

29 septembre -- Un nouveau site a été ouvert le 23 septembre: les Cyberbibliothécaires.  Il s'agit du volet éducatif de l'usage d'Internet pour les jeunes du réseau Éducation-médias.  Il comprend deux parties.  La première est destinée aux bibliothécaires et la seconde au public.

La partie professionnelle comprend trois documents: Gérer Internet à la bibliothèque, Trousse de communication et de promotion et Ateliers La Toile et les jeunes pour les bibliothécaires. La seconde partie a six documents dont Recherche et authentification de l'information dans Internet.

Cependant, certaines informations ne sont pas à jour entre autres celles de la page Comment chercher dans Internet de façon efficace ? Avant de commencer... concernant les opérateurs booléens.  «La plupart des moteurs de recherche (parfois même ceux dont l'interface a été traduite) utilise la forme anglaise : AND, OR et AND NOT », est-il écrit.  En fait, l'opérateur SAUF se traduit par AND NOT (AltaVista), - (Google) et ANDNOT AlltheWeb).

Statistiques d'août: MSN.ca toujours en tête

29 septembre -- Les statistiques de fréquentation des sites canadiens français du mois d'août n'ont pas révélé de fluctuation notable.  La fréquentation des sites de recherche est demeurée stable.  MSN tient toujours ses 2 millions, suivi de Sympatico, Google, La Toile du Québec, Yahoo et GlobeTrotter.  Seul Yahoo! se démarque avec une progression de 10%, le ramenant à son état du printemps.

Source: Infopresse

Kaltix revient au bercail

30 septembre -- Kaltix est une jeune entreprise créée en juin 2003 issue du groupe de travail dédié à l'amélioration de l'algorithme de classement PageRank de Google à l'Université de Stanford.  L'objectif de Kaltix est de personnaliser la recherche.

Kaltix avait ouvert son site, maintenant fermé et redirigé vers Google qui vient de l'acheter.

Sans aucun doute, la prochaine bataille sera la personnalisation poussée de la recherche consistant à établir un profil utilisateur. Le profil contiendra des données personnelles telles que les habitudes de navigation.  On peut croire aussi qu'il pourrait contenir des noms d'utilisateur et des mots de passe pour l'accès à des sites commerciaux ou aux archives de publications. Cette prochaine étape de la recherche devra se faire dans un cadre sécurisé.  Les profils d'utilisateur sont utilisés depuis plusieurs années mais non pas encore été appliqués à la recherche web.  Yahoo! offre ce cadre sécurisé avec son service Mon Yahoo!  Nous devrions voir un service semblable avec Mon Google qui serait relié à la barre d'outils.  Cette barre d'outils est un enjeu capital pour la fidélisation.  Elle permet de faire une recherche à partir du bureau sans se rendre sur le site de recherche.  Microsoft est entré dans cette course qui intégrera la recherche et la gestion de l'information dans son prochain système d'exploitation.

Source:
Google. Google Acquires Kaltix Corp. Communiqué, 30 septembre 2003
Stefanie Olsen. Searching for the personal touch in CNET News.com, 11 août 2003
Martin LaMonica. Microsoft to reveal more Longhorn details in CNET News.com, 29 septembre 2003


Accueil DSI

Service de recherche documentaire DSI. 1280-4, boulevard de Montarville. Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: info@dsi-info.ca
Adresse de cette page : Marc Duval. (Page créée le 16 avril 2001).  « Les brèves de DSI ». [En ligne]. Longueuil. Québec, ©2002. http://www.dsi-info.ca/actualites/breves.html
Rubrique « renseignements-service » des Pages Jaunes / Montréal - Centre / Montréal - Rive-Sud
©2001-2002. Marc Duval.