DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2003-11-27



Microsoft rechercha tout
Microsoft planifie de faciliter la recherche d'informations hétérogènes - documents d'applications différentes - sur son prochain système d'exploitation du nom de code LongHorn.  Le module de recherche pourra récupérer des liaisons, des fichiers de musique, des courriels et d'autres fichiers d'applications courantes sans oublier Internet. Longhorn inclura une technologie sous-jacente appelée WinFS, tirée en partie du Serveur de SQL de Microsoft, qui permettra aux applications de tirer des données d'une base de données unifiée.
Cette fonction de recherche n'est pas nouvelle.  AltaVista Discovery, entre autres, permettait une recherche de multiples formats de documents.  Microsoft aura poussé son développement.
Source:
Microsoft's plan to Google hard drives in ZDNet UK, 25 novembre

posté par Marc Duval, #référence - 00:24



Mise à jour de Kartoo
Lundi 24 novembre, Kartoo a émis un communiqué sur la mise à jour de son site.  Le site a reçu plusieurs améliorations autant dans sa présentation plus claire que dans ses fonctionnalités.  Kartoo mérite une analyse complète de son site que j'espère présentée le mois prochain.  Tout comme dans Copernic, le grand absent est Google.  Kartoo a détourné son absence en ajoutant Yahoo! et la Toile du Québec.  Entre autres, les globes représentant les sites sont devenus des pages.  Deux irritants demeurent, la grandeur de la carte qui demande un grand écran et la lenteur à rendre le résultat de recherche.  Kartoo semble avoir retiré son formulaire de recherche.  Il se rabat sur les préfixes de recherche.

posté par Marc Duval, #référence - 00:23

2003-11-25



Citation de la semaine: Overture un «moteur de recherche»

Lu dans La publication Tendances/Trends, «Des résultats influencés par la publicité. Les moteurs de recherche vous trompent-ils ?»
«Les moteurs de recherche sont très prisés pour trouver des informations sur l'Internet. Sont-ils objectifs ? Pas toujours. Certains, comme Overture, fournissent des résultats où sont privilégiés les annonceurs. Google applique une solution mixte.»

Overture n'est pas un «moteur de recherche» mais une banque de données commerciales.   Elle est partenaire depuis plusieurs années avec Inktomi présent sur MSN et HotBot.  La requête "Google" sur le site d'Overture donne 2 liens commerciaux (sponsored listing), puis suivent les références d'Inktomi (additionnal listing).  Les liens commerciaux d'Overture sont identifiés discrètement.  Voir la même requête "Google" sur AltaVista et les mêmes liens publicitaires en tête de liste sous la mention «Résultats sponsorisés».

posté par Marc Duval, #référence - 00:08

2003-11-24



Looksmart regroupe ses services
Looksmart a entrepris la même démarche que Yahoo! et Ask Jeeves en regroupant ses services sur son site.  Looksmart.com comprend maintenant la recherche web avec 1,4 milliards de pages de WiseNut et son service Articles de FindArticles en collaboration avec Gale.  FindArticles est une banque de données de plus de 3 millions d'articles issus de plus 700 revues et journaux.  Elle couvre de 1998 à aujourd'hui.   Cette couverture en fait une banque de références incomparable sur une multitude de sujets.
La banque de données FindArticles est indexée en partie par AltaVista depuis plusieurs années avec plus le 19 000 articles et AlltheWeb avec un peu plus de 39 000 articles. Inktomi/HotBot comprend plus de 24 000 articles et bibliographies.  Google recense plus de 295 000 articles de FindArticles.
Source:
LookSmart Launches Web's Largest Full Text Article Search, Communiqué, 24 novembre

posté par Marc Duval, #référence - 22:58

2003-11-20



Google-Filter contre le spam
Google est la source de plusieurs sites.  Le répertoire ODP liste plus de 200 sites de Google et sur Google.  Un nouveau est apparu en octobre: Google-Filter.  Je lui ai consacré une chronique: Google-Filter contre le spam.  Le spam dont il est question est celui de la publicité intrusive de certains sites.  Cette publicité  provient entre autres des liens d'affiliation anonymes qui sont l'unique contenu de pages web.  Grâce à ces liens, plusieurs de ces pages parasitaires réussissent à se hisser parmi les dix premières d'un résultat de recherche.

posté par Marc Duval, #référence - 21:08

2003-11-18



Gigablast: vérificateur orthographique
Matt Wells, le concepteur de Gigablast, a introduit un vérificateur d'orthographe basé sur le web et non sur un dictionnaire.  Le vérificateur est comparable à celui de Google.  M. Wells compte acquérir de nouveau matériel pour traiter 5 milliards de documents d'ici à un an.
Source: Rants & Raves, Gigablast, 18 novembre.

posté par Marc Duval, #référence - 18:22

2003-11-17



MSN teste un service d'actualités web
Microsoft a mis en marche son robot MSN Newsbot.  Ce nouveau service mis à l'essai est comparable aux Actualités de Google.  Il passe au peigne plus de 4000 sources en collaboration avec Moveover.  Son service dessert l'Espagne, la France, l'Italie et le Royaume-Uni .  Il a neuf rubriques: A la une, les articles consultés, le Monde, France, Affaires, Sport, Divertissement, Sance/Santé et technologie.  Son module de recherche ne comprend pas le choix entre l'affichage par pertinence et par date.   Le logiciel a quelques problèmes de reconnaissance de caractères accentués.
Les utilisateurs de MSN Passport pourront avoir un service d'actualité personnalisé à partir des articles lus.
Présentement, MSN utilise les services d'actualités de tiers.
Source:
Microsoft tests Web news service, CNET News, 17 novembre
posté par Marc Duval, #référence - 19:00

2003-11-09



Les suggestions de Google
Google essaie la fonction de suggestion de requêtes (capture d'écran d'un extrait de page) depuis quelque temps.  Des essais sont apparus le samedi et dimanche - 8 et 9 novembre - sous la forme de Did you mean: apparaissant en haut et en bas du résultat de recherche.  En septembre, Google avait utilisé l'expression «Related searches».  Sa particularité est d'avoir ajouté la requête autres - something else - qui relance la recherche en retranchant toutes les autres propositions.  Elle n'est pas aussi généreuse que celle de MSN (exemple: requête car).  En contrepartie elle a une utilisation plus large, semble-t-il.  Cette fonction n'est pas encore apparue dans la page d'interprétation du résultat.  Notez que Did you mean: est aussi utilisé pour proposer un autre orthographe.  Cette dernière fonction est commune à la plupart des automates de recherche majeurs.
La suggestion de requêtes s'ajoute à l'opérateur  ~  [tilde] de recherche de synonymes.

La suggestion de recherche est devenue courante chez les automates de recherche.  Par exemple, Chez AltaVista, elle se nomme AltaVista Prisma, chez Teoma et Ask Jeeves c'est «Related Search»,  chez Lycos c'est «Narrow your search»,  chez Voila c'est «Précisez votre recherche».

Mise à jour 2003-11-11:
L'expression «Related searches» est revenue. «Something else» est devenue «Something different»

posté par Marc Duval, #référence - 10:08

2003-11-06



Google investirait l'IRC
Une  rumeur circule selon laquelle Google aurait lancé ses robots sur les chemins de l'IRC, le réseau internet du clavardage.  L'IRC est considéré privé.  Il englobe des lieux de discussions où l'on aurait pu croire les écrits éphémères.  Nenni, les textes échangés seraient conservés.  Google aurait fait main basse sur plus de 2 terabytes de conversation.
Les passages furtifs des robots de Google ont été remarqués.  Il s'agirait d'un essai pour investir l'espace IRC et peut-être les chambres privées.  Or cet espace est la zone de l'Internet où fleurissent différents argots, où les fichiers s'échangent, où se loge un monde interlope.  Si cette rumeur s'avère, cette zone serait ouverte et Dieu seul sait ce qu'un chercheur averti pourrait trouver.  Google pourrait ouvrir une boîte de Pandore.
Source:
Google trawls chat in The Register, 6 novembre

posté par Marc Duval, #référence - 22:43



Une Google Deskbar pour contrer MSN
Google vient d'engager la «bataille du bureau» en mettant en service une barre d'outils de recherche de bureau.  Cette barre d'outils placée sur le bureau permet une recherche sans ouvrir un fureteur.

Dès le lancement de l'installation, Google avertit qu'il retirera des informations «anonymes» pour améliorer sa barre.  La case d'approbation est cochée par défaut.  La barre d'outils de bureau s'installe facilement.  Elle s'active en ouvrant la fenêtre des barres d'outils du menu de l'horloge.

La barre d'outils de bureau donne l'accès à tous les services de Google.  En plus, Google a placé trois sites de recherche  pour la recherche de logiciels avec C/Net, des revues de films - en avec Rotter Tomatoes, à un dictionnaire - qui contient un hyperlien vers Ask Jeeves (c'est à se demander s'il n'y a pas une relation privilégiée entre eux) et l'information financière avec Yahoo! (encore un concurrent!).  Accompagnant le dictionnaire, Google a inséré le raccourci «define» sous la rubrique Definition.

La barre d'outils de bureau de Google a sa propre fenêtre de visualisation.  L'internaute peut se rendre à son fureteur en cliquant sur le coin supérieur gauche.  Il peut aussi naviguer dans ses résultats de recherche avec les flèches vers la page précédente ou suivante.  La fenêtre est fermée en cliquant sur le coin supérieur droit.

La barre d'outils de bureau de Google est étonnante.  L'interface de recherche par défaut  est modifiable.  L'ouverture et autres fonctions peuvent passer par des raccourcis clavier.  Par exemple, le curseur passe directement dans la case de recherche de Google avec Ctl + Alt + G.  Sa propre fenêtre de visualisation est modifiable.  Enfin, des sites de recherche peuvent être intégrés à la barre comme AlltheWeb.  L'installation d'un site concurrent est d'une facilité déconcertante.

Sans aucun doute, cette barre d'outils de bureau est une révolution en matière d'accès à la recherche.  Il donne un aperçu de ce que sera la recherche avec le prochain système d'exploitation de Microsoft.  Elle le forcera peut-être à donner accès à ces concurrents.

Google est le deuxième site de recherche majeur après HotBot à lancer une barre d'outils de bureau. The Dave's Quick Search Deskbar est le précurseur de ces nouvelles barres.

posté par Marc Duval, #référence - 18:45



Yahoo! le chercheur
Yahoo! US a modifié sa page d'accueil.  Le répertoire s'est doté d'une case multi-recherches comprenant la recherche web, images, pages jaunes et produits... mais pas dans son répertoire ni dans les actualités.  L'accès à ces différents services de recherche ne semble pas être diffinitif.  Tantôt il est sous forme d'onglets (sous Internet Explorer), tantôt sous forme de liste déroulante (sous Netscape).  Tous les services de recherche apparaissent en haut et en bas des pages du résultat de recherche.  La modification de la page d'accueil indique que Yahoo! s'oriente de plus en plus vers un site de recherche complet et non plus comme un simple répertoire/portail mettant non pas en évidence ses services de recherche mais y donnant un accè direct.

posté par Marc Duval, #référence - 07:33

2003-11-05



Ask Jeeves améliore sa recherche de produits
Ask Jeeves a suivi Yahoo! en ajoutant un formulaire dirigée à sa recherche de produits.  Un formulaire dirigé est une liste de produits ou de sujets placée sous une rubrique pour préciser une recherche.  Les catégories de recherche sont appelées à s'étendre de cinq à dix dans les prochains mois.  Le partenaire de Ask pour ce service est PriceGrabber.
L'annonce du formulaire dirigée suit celle de la nomination de M. Steve Berkowitz au poste de directeur général (CEO) à compter du 1er janvier 2004.  Il remplace George "Skip" Battle.
Source: Ask Jeeves Expands into Product Searches in eWeek, 4 novembre.

posté par Marc Duval, #référence - 00:22

2003-11-04



Lycos symplifie la recherche
Lycos US a modifié sa présentation.  Il est passé de portail à site de recherche.  En plus d'avoir la traditionnelle case de recherche, Lycos a mis en évidence les 10 requêtes les plus en demande et 14 requêtes en langage naturel.  Les requêtes en langage naturel sont reformulés au moment de la validation.  Deux recherches thématiques «In Search» accompagnent les autres outils de recherche.   Au moment de la consultation, les thèmes étaient le tatouage et les meilleurs plans de téléphones cellulaires.

posté par Marc Duval, #référence - 23:55



Startium et QuickCrawler, deux nouveaux métachercheurs
Deux nouveaux métachercheurs sont apparus cette année arrivés tout droit de Belize:  Startium et QuickCrawler.
Startium est composé d'un champ de recherche, d'une zone météo paramètrable, d'une zone horoscope, d'un tableau de pointage des sports professionnels nord-américains, le résultat de lotos des États-Unis et les actualités en provenance de Google News.
Startium recherche à travers 13 sites de recherche: Ask Jeeves, Fast, Overture, LookSmart, About, Sprinks, FindWhat, QuickCrawler, ah-ah, SearchHippo, Open Directory, Dogpile, Kanoodle, Webcatalog et Teoma.  Il comprend un «répertoire» qui consiste en une liste de requêtes classées par rubriques.  Il utilise le même modèle pour la recherche de produits et services.  Le service d'informations financières est en partenariat avec QuoteMedia, Interest Alert et NAQ.
Startium a un formulaire de paramètrage de recherche: choix de l'opérateur par défaut, tri par sources ou par pertinence, nombre de notices par page, temps de traitement et le choix de l'interface.  L'affichage par défaut est par sites de recherche.  Startium est enfin équipé de la fonction de suggestions de recherche.
QuickCrawler est la version épurée de Startium avec les mêmes caractéristiques de paramètrage.  L'affichage par défaut est par pertinence et la fonction de suggestions de recherche plus développée. Il n'a aucun service d'actualtés ni d'informations financières. Son «répertoire» n'a que neuf rubriques/requêtes

posté par Marc Duval, #référence - 23:32

2003-11-02



Google, 2e au Canada français
Septembre a vu le site de Google Canada prendre le pas sur celui de Sympatico.  Il est entré dans le club sélect des 2 M de visiteurs, seul avec MSN.
En terme d'automates de recherche, Google domine en étant présent sur Sympatico, la Toile du québec et Yahoo! Canada.
En 2004, MSN et Sympatico fusionneront et Yahoo! devrait intégrer l'un de ses services de recherche (Inktomi, AltaVista et AlltheWeb) acquis cette année.


MSN.caGoogle.ca
Sympatico Toile du Québec Yahoo.ca GlobeTrotter
Décembre 23311589
2273 1345 923 631
Avril 2554 1708
1982 1439 931 543
Mai 2510 1974
2238 1366 919 572
Juin 2505 1829
1928 1399 912 618
Juillet 2312 1694
1895 1316 832 548
Août 2350 1706
1876 1313 937 627
Septembre 2285 2062
1864 1295 893 438
Source: «Google.ca à la hausse», Infopresse, 31 octobre 2003

posté par Marc Duval, #référence - 11:38


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.