DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2003-04-28



PageRank: nouvelle étude
Une nouvelle étude sur l'algorithme de classement de Google, PageRank, vient d'être publiée.  Intitulée Adaptive Methods for the Computation of PageRank [Méthode adaptative pour calculer le PageRank], les auteurs Sepandar Kamvar, Taher Haveliwala et Gene Golub ont observé «que les modèles de convergence de pages dans l'algorithme PageRank ont une distribution non uniforme. Spécifiquement, beaucoup de pages convergent vers leur vrai PageRank rapidement, tandis que d'autres prennent un temps beaucoup plus long à converger. En outre, [ils observent] que ces pages lentes à converger sont généralement des pages avec un haut PageRank. Par cette observation. [ils ont développé] un algorithme simple pour accélérer le calcul de PageRank dans lequel le PageRank des pages qui ont convergé ne sont pas recalculées à chaque itération après la convergence. Cet algorithme, [qu'ils appellent] PageRank adaptatif, accélère le calcul de PageRank de presque 30%.»

posté par Marc Duval, #référence - 19:46

2003-04-27



Tous les outils en une page
Le répertoire Tous les outils en une page de Jean-Pierre Lardy a été mis à jour ce mois-ci.  Le répertoire comporte quelques anomalies.  Excite France a été mis au cimetière.  En ce mois de Pâques, Excite France a ressuscité.  Il manque AlltheWeb News et NewsNow dans la recherche dans les dépêches.  Dans les «moteurs de recherche» francophones, Caloweb est devenu Caloga.  Il a changé aussi de partenaire de recherche en changeant Google pour Fast Search (AlltheWeb).

posté par Marc Duval, #référence - 14:07

2003-04-23



Catégorisation et publicité contextuelle pour Google
Google vient d'annoncer par communiqué l'acquisition de la société Applied Semantics.  Cette société s'est spécialisée dans la catégorisation, la synthèse et l'extraction de mots clés de documents courts (articles d'actualités et pages web) pour les journalistes, les rédacteurs, les bibliothécaires, les archivistes, etc.  Un autre produit connexe intéresse Google: la gestion de l'information (extraction de mots clés) pour la publicité contextuelle.

posté par Marc Duval, #référence - 20:57

2003-04-22



Le jour de la Terre
Nous sommes habitués à voir les logos évènementiels de Google incrustés d'une requête.  Aujourd'hui, Google a sorti un nouveau logo pour Le jour de la Terre comprenant la requête «+Earth +Day».  Mamma a repris l'idée - à moins que ce soit l'inverse!

posté par Marc Duval, #référence - 10:26



Un répertoire pour Google
Le site Indicateur vient de publier un répertoire sur Google.  Le répertoire met en ordre le contenu du site de la société californienne qui est devenu un capharnaüm.  Le répertoire déborde du site googléin avec des adresses vers des pages et sites spécialisés comme les brevets, les publications et les fiches techniques, les carnets, etc.
Le site est en anglais.  Une version en français est prévue.

posté par Marc Duval, #référence - 09:32



Jeeves s'anime
Saviez-vous que le majordome Jeeves du site Ask Jeeves est animé?  En rafraîchissant la page d'accueil, il adopte plusieurs positions vous invitant à la recherche.

posté par Marc Duval, #référence - 09:31

2003-04-20



Des images pour Ask Jeeves
Depuis 1 semaine, Ask Jeeves  s'est renouvelé. Ask Jeeves a ajouté un catalogue d'images à ceux du web, des actualités, de produits commerciaux et de Ask Jeeves Kids. Top Search remplace Jeeves IQ et le répertoire a été retiré.  Il en a profité pour enlever les onglets au-dessus de sa case de recherche et pour faire la promotion de sa barre d'outils lancé en juillet 2002.
Selon Ask Jeeves, le temps de chargement est maintenant 50% plus rapide.  La page du résultat de recherche a été redessinée. Le correcteur d'orthographique apparaît sous la case de recherche lorsqu'une faute est détectée.  Le résultat de recherche provenant de Teoma est encadré au-dessus et en-dessous par deux modules de référence - dictionnaires, abréviations, extension de recherche - provenant de Ask Jeeves selon la requête.  Entre le premier module et le résultat de recherche se trouvent les liens commandités encadrés de Doubleclick et de Google, à la fin du résultat apparaît à l'occasion des liens provenant du métachercheur Mamma, enfin, la recherche reliée est placée dans une colonne à droite du résultat de recherche. Le résultat de recherche affiche les actualités reliées au sujet le cas échant recherche. Il est à noter qu'AlltheWeb a été le premier à agréger ses catalogues.
Le site de Ask Jeeves a été conçu pour l'internaute anglophone moyen, sans formulaire de recherche.  Ce formulaire est destiné à Teoma.  Ask Jeeves ne cherche pas à impressionner en signalant ni le temps pris par la recherche, ni le nombre de pages trouvées.
Ce nouveau Ask Jeeves répond au souhait que j'avais fait le 13 avril. Google devrait suivre cet exemple au courant de l'année.

posté par Marc Duval, #référence - 13:48



OpenFind ouvert à Taiwan
Depuis quelques semaines, le site  de Openfind est en «reconstruction».   Toutefois, celui d'OpenFind Taiwan est pleinement opérationnel en portail.  Il comprend un formulaire de recherche, un catalogue d'images, d'actualités, d'audios, de logiciels, de publications, d'un répertoire, une section pour les actualités, une barre d'outils, un babillard, un service de courriel, un service de «chat».  Sauf effeur, c'est la première fois que je vois une recherche de logiciels contenus dans les pages web différente de la recherche FTP et un catalogue spécialisé dans la recherche de publications.  La recherche de publications est apparue avec Google (pdf et fichiers Microsoft);  OpenFind en fait un catalogue.

posté par Marc Duval, #référence - 13:46

2003-04-16



Des laborantins pour Google
Google inc. affiche une annonce d'embauche sur sa page Google Labs.  La société recherche des programmeurs de génie qui verront leurs trouvailles utilisées par des dizaines de milliers d'internautes.  A qui la chance!

posté par Marc Duval, #référence - 21:49



Google à Pitcairn
Google vient de sortir une nouvelle interface territoriale:  l'île Pitcairn.  Yahoo! Encyclopédie note:
«Île volcanique d'Océanie, en Polynésie, au S.-E. des Gambier; 5 km2; 59 h  île, découverte en 1767, fut colonisée par les mutins du Bounty, qui s'y installèrent en 1790. Les Anglais l'annexèrent officiellement en 1839, en tant que colonie.»
Huit autres interfaces nationales et territoriales se sont ajoutées avec l'île Pitcairn: le Honduras, l'île de Malte, l'île Maurice, l'île Samoa américaine, l'Ouzbékistan, le Rwanda, le Tadjikistan, le Vénézuela

posté par Marc Duval, #référence - 07:34

2003-04-15



Jeeves salue Léonard

Jeeves, le majordome du site Ask Jeeves, lève le verre à la santé de Léonard de Vinci pour son 551e anniversaire de naissance.  En pointant Jeeves, le majordome déguisé en Léonard lève un verre; en cliquant sur l'image, une recherche apporte un résultat hautement pertinent en anglais avec des pages sur sa biographie et son oeuvre.  Une liste de requêtes est affichée pour approfondir le sujet.  Vivement qu'Ask Jeeves s'internationalise!
posté par Marc Duval, #référence - 07:59



Overture tout azimut

Le dernier communiqué d'Overture annonce qu'elle entrera dans 7 pays au courant de l'année: l'Italie, l'Autriche, les Pays-Bas, l'Espagne, la Suisse, en Scandinavie et en Corée du sud.  En plus de cette croissance rapide, un centre de recherche a été ouvert à son siège social européen à Dublin pour desservir l'Europe.
posté par Marc Duval, #référence - 07:56

2003-04-14



Un dictionnaire pour AlltheWeb

AlltheWeb a ajouté le dictionnaire Dictionary.com le 8 avril dernier sur le même principe que Google.  Le ou les mots de la requête sont soulignés sous la case de recherche.  En cliquant sur le mot souligné, l'internaute est référé au site dictionary.com.  Sur cette lancée est apparue la liste des plus 10 récentes requêtes et une liste des raccourcis pour accélérer la recherche.  Cette dernière liste fait partie des préférences dans la page Keyboard Shortcuts.
posté par Marc Duval, #référence - 18:39

2003-04-13



Google à la Ask Jeeves?

Selon l'article In Searching the Web, Google Finds Riches du New York Times, Google prépare un logiciel qui pourrait déduire ce que veut un internaute en puisant dans une banque de données de questions/réponses.  Cela est à rapprocher de Ask Jeeves.   Google aurait pu constituer une banque de données de questions/réponses des internautes grâce à son système de fichiers témoin, à sa GoogleBar et à son service Google Answer.  Comme à son habitude, Google utiliserait un système automatisé.  Espérons que Ask Jeeves inc. ait pris connaissance de cet article pour couper l'herbe sous le pied de Google en fusionnant Teoma et Ask Jeeves.  Cette fusion serait une révolution aussi importante que l'arrivée de Google.  
posté par Marc Duval, #référence - 10:30

2003-04-09



Nouvelle chronique

Une nouvelle chronique de la recherche est disponible.  Elle s'intitule «La pertinence de Google: une étude de cas».  J'ai fait une analyse du lien «www.fcm.fr» à la suite d'un article du magazine Zataz.  J'ai tenté de voir pourquoi ce lien apparaît parmi les premières références résultant de la recherche «cinema» dans Google France. Cette modeste étude est un exemple des nombreux liens de sites disparus et récupérés soit par le propriétaire, soit par un tiers.  Ces propriétaires utilisent ces liens comme leurre pour attirer quelques poissons qui feront augmenter artificiellement leur traffic. Est-ce que cette pratique est profitable? Voir.
posté par Marc Duval, #référence - 23:49

2003-04-07



Norme ISO pour les métadonnées

Les métadonnées de Dublin Core a franchi une nouvelle étape pour la normalisation.  L'Organisation internationale de normalisation a enregistré la norme ISO 15836:2003(E) : Information and documentation — The Dublin Core metadata element set (Information et documentation — Éléments fondamentaux de métadonnées appelés).  La norme encadre 15 métadonnées: Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, Rights.
Le texte est aussi disponible avec ses références en hyperliens.  La prochaine étape sera l'approbation finale.

posté par Marc Duval, #référence - 17:42



Yahoo! Formule améliorée

Yahoo! vient d'annoncer un nouveau formulaire de recherche qui regroupe la recherche web avec Google, le répertoire Yahoo!, les actualités Yahoo!, les pages jaunes et une nouveauté: les images avec Google Images.
Le résultat de recherche dans Yahoo! News n'a subi aucun changement: les actualités récentes et gratuites sont au début et les archives payantes à la fin.  Élément intéressant: Yahoo! y a intégré la sauvegarde de la recherche et le tableau des requêtes sauvegardées.
Yahoo! a développé 5 raccourcis dans la recherche web : «map adresse» pour la recherche de carte par Yahoo! Map, «weather ville» pour la recherche de la météo dans Yahoo! Whether, «news requête» pour la recherche dans les actualités de Yahoo! News, «code zip produit» pour la recherche locale d'entreprises dans Yahoo! Yellow Pages, «define mot» pour la recherche d'une définition d'un mot dans le The American Heritage® Dictionary et «service!» pour rechercher un service de Yahoo!  Le point d'exclamation  suivant immédiatement le service sert à désigner qu'il s'agit d'un service Yahoo!  Notez que ces raccourcis ne sont pas ceux que l'on retrouve sur Google.
Yahoo! a renouvelé son formulaire de recherche web notamment pour la recherche par domaines.  Une nouveauté à son formulaire de recherche: les produits.  Ce sont les produits vendus sur le site de Yahoo! et non du service Froogle de Google.
Pour faire suite à ce lancement, la barre d'outils a été redessinée pour inclure les nouveautés.
Un tour du propriétaire est disponible en cliquant sur «Take the tour» sur la page d'accueil.  Voir aussi la page d'aide de Yahoo!

posté par Marc Duval, #référence - 13:22

2003-04-06



Francité: barre d'outils

Francité a ajouté une barre d'outils à ses services.  La barre comprend l'accès à DeepIndex, à ses services et à 25 sites de recherche: Francité, Yahoo, Nomade, Toile du Québec, Voila,  Sympatico, Telus, AltaVista France, Sharelook, AOL, DMOZ France, Google, AltaVista, Exite, Northern Light, HotBot, MSN, DMOZ, Metacrawler,  Webcrawler, Beaucoup, Search.com, ZDNet et Zone shareware.  Elle offre des fonctions de marqueur des mots recherchés dans le résultat de recherche et de liste dans la barre d'outils. Francité y a inclus des liens vers les rubriques «Actualités» et «Météo» et vers des sites «Astrologie» et «Jokes».
posté par Marc Duval, #référence - 11:10

2003-04-02



Rumeur sur MSN Search

Selon un article de AP, Microsoft serait tenté par l'aventure des liens commandités pour devenir le rival d'Overture et de Google.  Cette rumeur a eu des conséquences fâcheuses sur les actions d'Overture.  Microsoft l'a démenti bien qu'il poursuit ses investissements dans la recherche d'un meilleur automate que Google.  Microsoft pourrait entrer dans la danse d'ici à 2004, au plus tard 2005.
posté par Marc Duval, #référence - 22:47



Perles de journalistes

A la lecture de certains textes, je me demande où certains journalistes vont chercher leurs  informations.
Lu sur 01Net, «Pour limiter la recherche à l'écrivain, il faudra taper « Victor Hugo » (avec les guillemets) pour que Google cherche ce que vous souhaitez.» [DSI: il faut utiliser les guillements anglais sans espace - "Victor Hugo".]
Lu sur 01Net, «En tapant presse site: irak , vous trouvez par exemple l'ensemble des articles de presse concernant ce pays.» [DSI: le préfixe «site:» fonctionne avec un nom de domaine. Ex.: presse site:www.dsi-info.ca]
Lu sur NouvelOb: «Sa spécificité (Google) est de chercher alors que les autres moteurs s'apparentent plus à des annuaires où l'on doit s'inscrire pour être référencé» [DSI: Tous les automates fonctionnent sur le même modèle.]
Lu sur le Soir: «Il (Google) est le seul moteur de recherche capable de fouiller 6 milliards de pages web...» [DSI:  «Nombre de pages Web recensées par Google : 3,083,324,652», dixit Google.]

posté par Marc Duval, #référence - 22:43

2003-04-01



Teoma sur Mamma

Mamma a annoncé avoir pris une entente avec Teoma pour introduire l'automate dans son tableau.  Après vérification, Teoma était déjà sur le site.
posté par Marc Duval, #référence - 19:51



AlltheWeb conseille

Depuis quelques temps, ATW est actif.  Cette fois-fois, il affiche des conseils sur sa page d'accueil :
«Find information about a particular website by searching for URLs» (Trouver toute l'information sur un site en recherchant avec l'URL).

posté par Marc Duval, #référence - 19:51



InfoSpace

InfoSpace a annoncé le 31 mars que le retrait de ses messages publicitaires «pop up» et de ses bannières étaient la cause de l'augmentation de son achalandage. Aussi, la publicité ciblée devrait remplacer complètement celle traditionnelle.
posté par Marc Duval, #référence - 19:50


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.