DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2003-07-31



Yahoo! France pratique
Yahoo! France s'est lancé dans les raccourcis pratiques dans deux domaines: la finance et les actualités.
En entrant « convertisseur de devises », un convertisseur apparaît.  Cinq devises sont inscrites: dollar, euro, franc suisse, livre et yen.  Bien d'apparence restrictive, en cliquant sur le bouton «couvertir», Yahoo! nous offre un convertisseur plus complet.
Même approche pour les actualités.  Cette fois-ci le mot-clé est « actualité » suivi de votre terme de recherche.  Ce raccourci n'est pas encore au point.  Il est plus efficace de se rendre dans la section « Actualités ».  Yahoo! a voulu plaire aux amateurs de sport français en ajoutant les actualités sportives.  Entrez le nom d'une équipe sportive et Yahoo! vous donnera les actualités qui lui sont reliées.
Pour faire le tour des nouveautés, suivez le guide.
Cette nouveauté française vaut bien la nouvelle case de recherche de produits du Yahoo! US et son interface.  Cette interface qui recherche dans la section d'achat est la suite de la mise en valeur des produits de Yahoo!  Elle comprend la recherche de valeurs d'un produit et un comparateur de prix.  Chez Yahoo! France, la section « Shoping » a été en en avant-garde en s'associant avec Kelkoo.  Est-ce un réponse au service de Froogle de Google?  Certainement pour l'interface de recherche, mais non pour le service d'achat.  Le service de Yahoo! est payant, pas le service Froogle selon la description qu'en fait Google du moins pour l'instant.

posté par Marc Duval, #référence - 23:37



Zapmeta, le dernier né des métachercheurs
Un nouveau métachercheur est arrivé avec un formulaire de recherche détaillé dans sa besace: Zapmeta.
Le métachercheur puise dans AltaVista, WiseNut, Gigablast, Yahoo, MSN, Open directory, AlltheWeb, HotBot et AOL.   La recherche se fait dans la page entière, dans le titre, dans l'URL et par domaines.
La fonction de tri est développée.  Elle se retrouve par pertinence, par popularité, par source, par titre et par URL en ordre ascendant et descendant.  Le format d'affichage est modifiable.  Il peut comprendre la description, la source, l'aperçu de la page et l'URL.
L'aperçu de la page est une fenêtre qui s'ouvre après le titre.  Excite France et Vivisimo ont cette fonction.   La fenêtre de l'aperçu de la page nommé « Quick View » a deux formats: grand - Maximize - et petit - Minimize.  Une fonction d'inclusion comme signet - Bookmark site - est assortie aux formats d'affichage.  L'inclusion du signet est nouveau.  Elle pourrait s'avérer pratique.
Une liste de recherches reliées est affichée avec le résultat de recherche.
Enfin, Zapmata s'est associé à l'Open Directory Project qui affiche les rubriques associées à la requête.
Dès sa première année, Zapmeta a tous les attributs pour se joindre au cercle des Vivisimo.  Il ne lui manque qu'un système de classement.

posté par Marc Duval, #référence - 00:25

2003-07-30



Google en Inde
Les interfaces nationales de Google viennent de s'enrichir de l'Inde.  La nouvelle interface indienne est déclinée en cinq langues: le bengali, l'hindi, le marathe, le télougou et l'anglais.  Le bengali est parlé par 189 millions de personnes, l'hindi par 187,le marathe par 65 millions, le télougou (ou télugu) par 66 millions.
Cette addition porte à 77 les interfaces nationales et territoriales sans compter les interfaces des principales langues nationales.
Source: PopulationData, données de 2000.

posté par Marc Duval, #référence - 20:54

2003-07-29



Statistiques
Les statistiques de fréquentation de juin des sites canadiens par les Canadiens français sont sorties.  MSN demeure dans les 2 millions de visites.  Sympatico est redescendu sous la barre des 2 milllions. Google (1,829 M), la Toile du Québec (1,399 M), Yahoo (912 000) et GlobeTrotter (618 000) ont de légères variations.  Google a ralenti sa progression.  Les prochains mois verront peut-être Google dépassé les 2 millions grâce à son nouveau service d'actualités en français.
Yahoo! Canada en français n'a pas réussi à rejoindre la Toile bien qu'il ait un meilleur formulaire de recherche pour interroger Google.  Il devrait envisager à étoffer sa section d'actualités canadiennes pendant qu'il en est encore temps. Sinon, Google pourrait poursuivre la régionalisation de son service comme il l'a fait en anglais.
Voici un graphique qui compare les sites de recherche entre eux d'avril à mai.
Source: Infopresse.

posté par Marc Duval, #référence - 22:16



HotBot modifié
Le 24 juillet, HotBot a modifié la présentation de ses automates de recherche.  Inktomi a repris son ancien nom HotBot alors qu'il était seul à la barre, AlltheWeb est devenu Lycos et Teoma, Ask Jeeves.  Seul Google est demeuré.   En définitive, les noms ont été remplacés par des plus connus.  La principale modification a trait à Ask Jeeves.  La page du résultat de recherche de Ask Jeeves a reçu un lien vers des « ressources » fournies par Teoma sous le titre « Try resources».  Ask Jeeves ne s'est pas amélioré pour la transcription des caractères avec des diacritiques.

posté par Marc Duval, #référence - 16:14



Google Actualités
Google Actualités vient d'être lancé pour la France.  Contrairement à Google News qui est décliné par pays dont le Canada anglais, Google Actualités France est affiché sur les interfaces des pays francophones, la rubrique France n'étant pas changé selon l'interface nationale comme le Canada.
La disposition de la page est identique à l'original.  Les actualités proviennent de 500 sources en français à travers le monde.  Elles sont collectées puis classées automatiquement en sept rubriques ( International | France | Économie | Science/Tech | Sports | Culture | Santé ).  Chaque notice a son titre, la source, le temps de diffusion,  les premières lignes de la nouvelle et d'autres sources ayant le même article ou un article connexe.  Une vignette accompagne les articles de la première page.  
Le logiciel de Google n'est pas encore au point avec quelques titres tronqués.  La nouvelle de NetÉconomie était absente des articles connexes mais présente dans le résultat de recherche sur Google.  Les notices du résultat de recherche peuvent être triées par date ou par pertinence.
Google Actualités n'a pas reçu de formulaire de recherche.  Cependant les préfixes de recherche «allintitle:», «source:», «allintext:» et «allinurl:» sont disponibles.
Il est à noter que Google a eu l'heureuse initiative de décrire le nouveau service dans une «foire aux questions».
La nouvelle du lancement a été fulgurante par l'AFP.  Actu Live, Le Nouvel observateur, TV5, Menara (Maroc), NetÉconomie et Blue win sont les premiers à la diffuser.  Au Canada, la nouvelle n'est pas encore sortie sur les grands sites de nouvelles.  Radio-Canada, Canoë, Branchez-vous, Bénéfice.net n'ont pas encore publié la nouvelle. Google News a eu un ou deux ratés au cours de la première année en insérant des communiqués de presse.  En plus des sources traditionnelles, Google News inclue des sources électronique tels que des forums de discussion comme Slashdot.  Verrons-nous un développement similaire?

posté par Marc Duval, #référence - 08:17

2003-07-28



Quand Google devise en latin
Google a inscrit une devise dans sa page d'A propos de sa barre d'outils.  Cette devise est De parvis grandis a cervus erit.  La traduction en anglais de cette devise est reprise à chaque année par quelques auteurs et réfère inéluctablement à cette page Mottoes from 16th-century sources.   La traduction qu'il lui est attribuée est « Small things will make a large pile ».  La traduction est juste mais pas la transcription de la devise.  Comme telle, elle n'a aucun sens.  Elle devrait s'écrire ainsi De parvis grandis acervus erit, soit «acervus» et non « a cervus ».   Quelques-uns ont fait la correction sans la souligner toutefois.
En français, la devise correspond au proverbe  « Les petits ruisseaux font les grandes rivières ».  Le Larousse l'explique ainsi : « les petits profits accumulés finissent par faire de gros bénéfices ».
La devise latine a été reprise de diverses façons accompagnée généralement d'une gerbe de blé d'où convergent des épis. La relation entre la devise et l'emblème est on ne peut plus claire.  Après tout, le blé n'est-il pas associé à l'argent?  Pour mettre un peu de couleur, l'équivalent québécois pourrait être « C'est avec des cennes qu'on fait des piastres ».
Elle a été publiée en français par Claude Paradin dans son livre Devises héroïques en 1557 (page 210), oeuvre revue et augmentée de 1551.  La devise a été publiée en anglais par Geoffrey Whitney en 1586 dans son livre Choice of Emblemes (page originale - page web) sous la traduction  From small things, there will grow a mighty heap (traduction: no 88 de la liste).
La ville de New York l'a utilisée à l'endos du billet de 1$ en 1775.
Le rapport  de Google avec l'argent est net.  Dès la naissance de Google, les concepteurs utilisaient du matériel peu coûteux, remplaçant les puissants ordinateurs utilisés par AltaVista par des ordinateurs personnels.  Cette philosophie se poursuit dans sa stratégie des liens commandités, petite contribution à la cagnotte comme l'épi à la gerbe.
La devise témoigne aussi de l'arrogance.  La faute n'a pas été corrigée dans la nouvelle version de sa barre d'outils. Pourtant sortie en décembre 2000, la barre d'outils de Google a gardé sa devise inchangée à moins qu'il n'y ait anguille sous roche.
Note:  Je remercie M. Pierre Salat pour son aide dans la traduction du groupe de discussion fr.lettres.langues-anciennes.latin
La discussion qui a eu lieu en 2002 sur le latin de Google est très instructive.

posté par Marc Duval, #référence - 23:35



AlltheWeb et les fichiers
Gary Price de Resource Shelf semble se spécialiser sur AlltheWeb.  Après nous avoir fait découvrir le préfixe de recherche «filetype» en décembre 2002, voilà qu'il nous revient avec les formats de fichiers indexés.  Il a repéré 3 formats de recherche: Microsoft Excel et PowerPoint.  La formulation est « filetype:excel » et « filetype:powerpoint ».  Vous remarquerez que les fichiers officiellement reconnus par AlltheWeb (Adobe Acrobat, MSWord et Flash) ont l'extension identifiée à droite du titre de la notice.
En fait, AlltheWeb indexe plusieurs formats de fichiers dont en : text, autocad, lotus123, css et autres.  Les préfixes de recherche officieux ne sont pas tous performants et plusieurs formats ne sont pas encore reconnus.

posté par Marc Duval, #référence - 19:16

2003-07-24



AltaVista remodelé
AltaVista a modifié la disposition de sa page d'accueil.  Auparavant, le nom et le logo étaient à gauche des onglets comme ils se trouvent encore sur la page de recherche des actualités.  Les outils étaient sur une ligne horizontale sous la case de recherche.  Maintenant le nom et le logo sont centrés au-dessus de la case de recherche.  Les outils ont remplacé la Place du marché à la droite de la page.  La promotion des services d'AltaVista sous forme d'icônes alternants et la barre bleue inférieure ont disparu.
La nouvelle disposition de sa page d'accueil lui donne une allure plus sobre.
Maintenant que Yahoo! est devenue propriétaire d'AltaVista, il est fort probable que cette société mette son répertoire au lieu de celui de l'ODP... en espérant qu'il ne le coule pas.

posté par Marc Duval, #référence - 00:57

2003-07-21



Netscape.fr: recherche multimédia
La recherche de documents audio et vidéo est revenue sur Netscape France après une absence de quelques semaines.  Cette fois-ci, j'ai pris une copie d'écran au cas où elle disparaîtrait encore.

posté par Marc Duval, #référence - 09:54

2003-07-20



Mort de pssst!
Le forum québécois «pssst!» vient de fermer.  Le secteur techno vient de perdre un forum sur lequel les enjeux et les nouveautés des sites de recherche avaient une place grâce à des collaborateurs comme Allergic et Afroginthevalley.  Branchez-vous a fait une chronique nécrologique de pssst!

posté par Marc Duval, #référence - 23:36



Google News: un formulaire de recherche
Google a ajouté un formulaire de recherche à son service des actualités depuis quelques temps.  Le formulaire du service des actualités est similaire à celui du web.  Il comporte cinq particularités :  le tri par pertinence et par date, la source ( News source), la localisation (location), l'emplacement [des termes de recherche] (Occurences) et la date de publication (Date).  La recherche par date de publication est limitée à un intervalle d'un mois ou 31 jours.  Deux options lui ont été attribuées: une division par plages fixes (heure, jour, semaine, mois) et une autre par intervalle de quantièmes couvrant deux mois.
Les préfixes de recherche sont: allintitle:, allintext:, allinurl:, source: et location:.  Le champ « date »  n'a pas de préfixe de recherche mais une ou plusieurs cases selon l'option.
En comparant Google à AltaVista et AlltheWeb, la recherche par champs et préfixes de recherche de Google est plus facile.  AltaVista et AlltheWeb offre un avantage commun: la recherche thématique.  AltaVista se singularise par sa catégorisation ou affichage des mots les plus fréquents [Alta Prisma] et AlltheWeb par la recherche par langues.  Aucun des trois n'est supérieur pour la recherche, mais tous ont une couverture différente.  C'est pourquoi il est préférable de faire une recherche dans les trois catalogues.
Note du 22 juillet:
21 juillet: Cette nouvelle appraît dans Resource Shelf, dans  Google Weblog  et dans Microdoc News.  Elle est reprise par  Associated Press parue dans plusieurs journaux et le Globe and Mail.
22 juillet: Cette nouvelle apparaît dans Webmasterworld.

posté par Marc Duval, #référence - 10:13

2003-07-16



Google: Danemark ajouté
Le Danemark est le 76e pays et territoires à être admis dans l'ONU de Google.  Il comprend deux interfaces: l'un en danois, l'autre en féroïen.  Pour se rendre d'une interface à l'autre, Google met un fichier témoin.  Si vous ne voulez pas demeurer prisonnier de l'une ou l'autre des interfaces, ne mettez pas de fichier témoin permanent mais temporaire.   Si vous le mettez par erreur, effacez les fichiers témoins de « www.google.dk » dans votre gestionnaire de « cookies ».

posté par Marc Duval, #référence - 07:35

2003-07-14



Yahoo achète Overture
Coup de théâtre: Yahoo vient d'acheter Overture.  Ce faisant Yahoo! aura une couverture du web phénoménale avec trois automates de recherche: Inktomi et AltaVista et Alltheweb.  Le coût de l'acquisition est de 1,63 milliards de dollars US.   Voici quelques titres qui viennent de sortir: Yahoo rachète Overture pour 1,63 milliard de dollars
Yahoo to buy Overture Services
Analyse : Yahoo! achète Overture pour 1,63 G$
Yahoo to buy Overture for $1.63 billion
Yahoo! buys! Overture!
.
posté par Marc Duval, #référence - 12:42



Google: interfaces nationales
Google a fait un ménage dans son tableau des interfaces nationales et territoriales de sa pages Les outils linguistiques.  Les interfaces Iles Cocos et le Tadjikistan ont été retirées.  Ce qui porte le nombre des interfaces nationales à 75.

posté par Marc Duval, #référence - 11:28

2003-07-11



MSN-Sympatico: le duo des 2 millions
Les statistiques de fréquentation des sites canadiens par les Canadiens français de mai ont été publiés cette semaine. Le «Top 25» de mai voit la montée de Google Canada qui est passé de 1,7 à 1,974 millions alors que les autres sites n'ont pas vu le nombre de visiteurs progressé. Le duo MSN-Sympatico ont drainé plus de 2 millions d'internautes durant ce mois. Au printemps prochain, le duo uniera leurs forces. Le nouveau portail pourrait atteindre les 3 millions.

posté par Marc Duval, #référence - 17:37

2003-07-08



Le bon outil
Lorsque vous recherchez un site, utilisez le bon outil.  Les automates de recherche  trouvent le mot exact, la même chaîne de caractères à moins de se nommer AlltheWeb qui a une fonction de suggestions.  Les répertoires sont plus souples en recherchant une chaîne de caractères à l'intérieur d'un mot, pratique pour une recherche d'un mot avec un pluriel simple.  Par exemple, le site du festival montréalais Francofolies ne sera par trouvé sur Google avec la forme « francofolie ».  Vous le trouverez à coup sûr avec la même forme au singulier autant sur la Toile du Québec et sur Yahoo! Canada en français.
En recherchant « francofolies » sur Google, vous trouverez une référence intitulée  « Les francofolies sur la route » dont le titre ne correspond pas à celle de la page sur laquelle vous êtes dirigé « Les francofolies de Montréal ».  En fait, Google a indexé une page ayant une redirection vers la page officielle.  La description provient de celle du répertoire Open Directory Project.  Pour voir la page indexée, il faut désactiver le JavaScript de votre fureteur.  Pour Netscape, il faut aller sur les «Préférences», puis sur «Avancé», enfin sur «scripts & modules externes».  De là, désactivez le Javascript de Navigator.  Pour Internet Explorer, essayez la méthode donnée par 01Net et bonne chance!  Dernier conseil: n'utilisez pas le répertoire de Google, il est inopérant, pour utiliser un euphémisme.  Et dire que Google est premier dans le Wired 40!

posté par Marc Duval, #référence - 23:19



Wired 40: Google premier
Le magazine Wired vient de publier son classement des 40 sites web les plus innovatreurs: le Wired 40.  Deux sites de recherche se retrouvent dans ce classement: Google en première position et Yahoo! en troisième.
Google reçoit la palme pour l'efficacité de son algorithme, pour ses deux nouveaux services - Google News et Froogle - et pour l'achat de Pyra labs le faisant leader dans les carnets web.
Yahoo! est salué pour le retournement de fortune effectué par Terry Semel.  De déficitaire, Yahoo! est devenu profitable.

posté par Marc Duval, #référence - 22:57

2003-07-07



Rafraîchissant AltaVista
Google est reconnu pour faire des mises à jour rapides.  Habituellement, il fait la mise à jour de mon carnet web dans un délai variant entre 24h et 48h .  J'ai fait un test de mise à jour des automates de recherche avec la nouvelle sur la balise « meta-keyword ».     Surprise! AltaVista est le premier à la faire dans un délai de 24 h avec la requête « enfiroiper ».  Ni Google, ni AlltheWeb, ni Inktomi, ni Teoma et ni Voila n'ont affiché la mise à jour du blog dans ce délai.  La page est apparue plus de 48h sur Google.  La baisse de performance de Google devient de plus en plus préoccupante.

posté par Marc Duval, #référence - 14:28



Les liens de Yahoo!
Yahoo! est un acteur majeur parmi les répertoires du web.  La maintenance de ses enregistrements ne semble pas être sa principale préoccupation.  Il y a quelques mois j'ai trouvé un site pornographique enregistré sous le nom de La Presse en ligne dans la rubrique « Actualités et médias Portails et annuaires » de Yahoo!  Était-ce une erreur de Yahoo?  Le site Wayback Machine confirme que non avec la dernière page d'archivage datée du 16 mai 2001.  La Presse en ligne portait bien son nom; il avait été retiré pour faire place à la société qui l'avait développé.  Le site pornographique a repris l'adresse sans formalité et s'assurait une place peinarde dans Yahoo!  Pourtant, ni l'adresse ni la requête «presse en ligne» ne procurent une position avantageuse chez aucun automate de recherche.  L'adresse devient une ruse pour qui vérifie l'historique d'une session web.    Ni Yahoo! France, ni Yahoo! Canada en français n'ont une adresse évidente pour dénoncer les sites « offensants » comme c'est le cas avec Yahoo! Canada.  C'est pourquoi j'ai utilisé le formulaire d'aide sur Yahoo! France trouvé dans la page Yahoo! Contact pour signaler la présence incongrue du site.   La réponse de Yahoo! France a été un message automatique et aucune action prise pour retirer le site.  Le 26 juin, j'ai repris l'opération.  Cette fois-ci, je suis allé sur la page Contact de Yahoo! Canada en français.   J'ai utilisé deux adresses: cf-webmaster@yahoo-inc.com  et cf-support@yahoo-inc.com.  En moins de 2 jours, le site La Presse en ligne était retiré.  Si vous voulez contribuer à l'épuration de Yahoo! en français, utilisez l'adresse électronique du support à la clientèle de Yahoo! Canada en français, plus efficace que le formulaire de Yahoo! France.
Aurais-je des représailles pour avoir joué au délateur?  S'il y a une suite, je la publierai ici
.
posté par Marc Duval, #référence - 14:27

2003-07-02



Meta-keyword et automates de recherche
Le 26 juin dernier, Sam-Mag a publié un article sur le référencement intitulé le Vrai / Faux du référencement. Voici un extrait qui m'apparaît intéressant:
«La balise keywords est très importante pour le référencement – FAUX
Les outils évoluent et avec eux, leurs algorithmes de référencement. Si la balise keywords a longtemps été prépondérante dans le positionnement d’un site, aujourd’hui, elle l’est moins.»
Il y a six mois, j'ai inséré un québécisme dans la balise Keyword de la page Saviez-vous que...  ? et sur celle des Actualités des sites de recherche en utilisant une orthographe rare: enfiroiper.  Enfiroiper ou enfirouaper signifie se faire rouler.  Les deux pages test sont disponibles sur 6 automates de recherche:  AlltheWeb, AltaVista, Google, Inktomi/HotBot-MSN, Teoma et Dir.  Après que j'ai utilisé la requête « enfiroiper » sur chacun d'eux, un seul automate a répondu à l'appel: Inktomi/HotBot-MSN.  Ce test corrobore en grande partie l'affirmation de Sam-Mag et aussi l'article How To Use HTML Meta Tags de Danny Sullivan.  En fait, la balise « keyword » n'a aucune utilité sauf pour Inktomi, ce qui n'est pas négligeable avec son réseau de partenaires dont MSN et bientôt avec celui de Yahoo!  Lorsque Yahoo! mettra en ligne Inktomi, ce dernier reprendra de la valeur pendant quelques mois, soit jusqu'à ce que MSN sorte son propre automate selon la rumeur.  A moins que Yahoo! ne modifie l'algorithme de Inktomi.
En complément,  la requête a été reconnue sur les métachercheurs Vivisimo, Mamma, Debriefing et Copernic, et non par Dogpile et Kartoo.

posté par Marc Duval, #référence - 22:08


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.