DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2004-08-31



Copernic Desktop Search: un aperçu

Copernic vient de lancer un logiciel de recherche globale, c'est-à-dire pour la recherche autant sur disque dur que sur le web nommé Copernic Desktop Search.
Le logiciel de recherche est correct pour les produits les plus populaires.  Il indexe les courriels de Microsoft Outlook seulement, les fichiers de Microsoft, de WordPerfect, d'Adobe, les pages web, les images, les fichiers musicaux, les fichiers vidéos, les favoris et l'historique de la recherche d'Internet Explorer seulement.  D'autres types de fichiers peuvent être indexés selon Copernic.
La gestion des répertoires et des dossiers à indexer est facile.  Elle permet de les ajouter et de les retrancher.
Les fichiers sont classés par dates, par répertoires ou par types de fichiers avec l'option de groupement.  Copernic Desktop comprend une visionneuse pour les fichiers de textes.  Chaque type de documents à chercher a son formulaire de recherche.  Les formulaires pour la recherche d'images et de vidéos sont minimaux.  Celui pour les images ne comprend que le champ date et celui des vidéos les champs taille et date.  Pourtant, ces fichiers ont une fiche de propriétés pour faciliter la recherche.
Après l'indexation des fichiers, des fichiers audios ont été classés avec les vidéos.  Il est à regretter que les fichiers vidéos n'aient pas de vignettes. Une autre déception est la séparation entre la recherche web et la recherche sur disque dur.  Le logiciel ne recherche pas sur le web ni sur le disque dur en sélectionnant des mots dans un document ouvert dans la visionneuse ou même dans le logiciel approprié.
Copernic Desktop utilise par défaut AlltheWeb pour la recherche web, d'images et d'actualités.  Il n'y a pas de recherche de fichiers multimédias.  La recherche de produits a été attribuée à Copernic Shopping.
La recherche de Copernic Desktop est accessible avec une case de recherche dans la barre d'outils de Windows et les documents peuvent être indexés en continu.  C'est un honnête logiciel de base offert gratuitement en anglais.  Il devrait répondre au besoin de la majorité des gens en indexant les fichiers les plus populaires.  Toutefois, il est nécessaire de remplir la fiche des propriétés de chaque fichier pour optimiser la recherche.
Lire:
Copernic se fait le champion de la recherche personnelle avec l'introduction de Copernic Desktop Search, Bénéfice.net, 31 août
Copernic offre « le seul outil de recherche sur PC méritant d’être utilisé », Copernic, communiqué, 31 août

posté par Marc Duval, #référence - 12:48

2004-08-30



Google en vignettes

Les vignettes dans le résultat de recherche étant dans l'air du temps, voici le ggler amalgamant les vignettes d'Alexa et le catalogue web de Google.  Très agréable à consulter sans témoins, ni liens commandités.
Source: Visualizing Google Search Results, Search Engine Watch, 30 août

posté par Marc Duval, #référence - 11:32

2004-08-24



Google Actualités ajoute la liste des sites nationaux

Google Actualités a ajouté le choix du pays dans une liste déroulante sur la page de la Une.  La liste se trouve sous la case de recherche.  Cette nouvelle liste d'accès est plus pratique que la liste des sites nationaux en bas de page.
posté par Marc Duval, #référence - 23:42



Lycos recherche dans les forums

Lycos a mis en ligne un nouveau service de recherche destiné aux forums de tous genres.  Discussion Search de Lycos fore dans le web, dans Yahoo Groups, dans MSN Groups et les sites du domaine .org.  Google Groups est ignoré.
 Discussion Search est adapté aux langues européennes; il sait donc discriminer les signes diacritiques.  Il dispose d'un filtre parental.  Discussion Search n'a pas de formulaire de recherche.  Il pourrait en avoir un si le projet a du succès.
Lycos a aussi amélioré la recherche d'individus avec People Search.  Ce service est destiné au marché des États-Unis.  Il utilise les annuaires de particuliers et commerciaux délivrés par Verizon.  Le service inclus la recherche web... et l'accès au dossier criminel moyennant des frais.

posté par Marc Duval, #référence - 23:39



Entente entre AOL et Girafa

Le 16 août, la société Girafa annonçait dans un communiqué qu'elle allait fournir les vignettes de pages web dans le résultat de recherche à CompuServe, Netscape, AIM et ICQ propriétés d'America Online, Inc.  La filiale française a choisi une société locale pour l'affichage des vignettes sur AOL France et Netscape France.  Selon le communiqué d'AOL France, il s'agirait d'une innovation.  Cette « innovation » est disponible par le biais de barres d'outils plus pratiques et plus novatrices telles que : Alexa et MoreGoogleViewpoint et Girafa.  Alexa fournit aussi ses vignettes à Thumbshots.net.  Chez AOL, qui gagnera la bataille des vignettes? Girafa ou la société locale française ?
D'autres sites de recherche comme Vivisimo, Excite France ou encore Ask Jeeves possèdent une fonction de visualisation des pages web par fenêtres.  Le métachercheur Copernic a aussi un aperçu des pages web mais en direct.
Rappelons qu'AltaVista France a été le premier automate de recherche à afficher les vignettes avec la fonction masquer les images en 2001 abandonnée depuis dans la tourmente qu'a connu AltaVista. Cette fonction n'est pas explicite sur les deux sites français d'AOL. Elle est représentée par une minuscule icône représentant une feuille lignée.
Malheureusement, les innovations d'AltaVista étaient trop d'avant-garde. Yahoo!, l'actuel propriétaire, ne semble pas vouloir reprendre le flambeau.
Enfin, soulignons que Google a abandonné le projet Google Viewer en mai dernier.

posté par Marc Duval, #référence - 09:40

2004-08-22



Infos privées de Moveon.org devenues publiques

L'article Moveon.org subscribers exposed de CNet News du 20 août relate la divulgation malencontreuse d'informations privées.  Une banale recherche d'un internaute à partir de Google sur des vidéos clips du groupement politique Move On a mené vers des informations privées d'abonnés.  Ces informations fournissent le nom, l'adresse courriel et les champs d'intérêts de l'abonné.  La mauvaise configuration des pages web a été rapidement corrigée.  Corrigée ? Pas tout à fait.  Yahoo! a gardé des fiches.  Il était possible d'en voir plus de 300 avec cette requête site:www.moveon.org subscription ce dimanche-ci, soit 2 jours après la publication de l'article et près de 60 sur Google avec la même requête, soit site:www.moveon.org subscription.  Il semble bien que la brèche n'ait pas été complètement colmatée.
posté par Marc Duval, #référence - 23:03



Toogle, quand une image vaut mille lettres

Un nouveau site de recherche d'images est apparu le 19 août sur Yahoo!  Toogle est la version texte de Google Images.  Il recherche et représente les images à l'aide des lettres de la requête selon le code ASCII.  Le webmestre prend soin d'avertir qu'il n'est pas responsable des images ni des requêtes crues affichées dans son tableau des requêtes les plus populaires.
posté par Marc Duval, #référence - 23:01

2004-08-20



Le carnet de Yahoo

Yahoo! a ouvert son carnet web ce 18 août.  Yahoo! Search Blog a été affiché dans les nouveautés du jour.  Il est le pendant de Google blog.  Ces carnets pourront fournir des informations précieuses, du moins c'est l'espoir qu'ils nous donnent.
posté par Marc Duval, #référence - 00:33

2004-08-18



Les olympiques de Dogpile

Il n'y a pas que Google qui s'intéresse aux jeux olympiques d'Athènes.  InfoSpace y contribue en ajoutant le fil de presse des J.O. sur la barre d'outils de Dogpile.
Source:
Dogpile Web Search Toolbar Now Offers Up-to-the-Minute Olympics Coverage via RSS, InfoSpace, Communiqué, 18 août

posté par Marc Duval, #référence - 22:14

2004-08-17



Les olympiques de Google

Depuis vendredi 13 août, Google arbore des logos aux jeux olympiques d'Athènes.  Vendredi, Google célébrait l'ouverture des Jeux, lundi c'était au tour de la natation et mardi, le tir à l'arc.  Google a ajouté une nouveauté en intégrant le logo du jour au formulaire de recherche et à la page du résultat de recherche.
posté par Marc Duval, #référence - 09:45



Fin du test de MSN Search

Microsoft a terminé le premier test de son automate de recherche.  Ce message apparaît sur sa page d'essai :

Merci à tous ceux qui ont testé notre service et qui nous ont envoyé des commentaires. Nous apporterons des améliorations fondées sur les suggestions reçues. Dès que nous serons prêts, nous lancerons une nouvelle pré-version de notre nouveau moteur de recherche algorithmique.

Dans le même ordre d'idées, nous avons a (sic) site qui comprend des pré-versions et des versions bêta de technologies MSN à venir : MSN Sandbox. Visitez MSN Sandbox et découvrez nos nouvelles idées de produits MSN.

Merci,
Équipe MSN Search

En visitant MSN Sandbox, vous pourrez voir et télécharger gratuitement le logiciel de recherche de courriels Lookout.
posté par Marc Duval, #référence - 00:39

2004-08-12



Six nouveaux drapeaux pour Google

Google a ajouté six nouvelles interfaces nationales à sa page d'outils linguistiques : l'Arabie saoudite, le Guatemala, l'Ouganda, l'Arménie (ancienne République soviétique), le Turkmenistan et la Mongolie.  Comme d'habitude, leurs inscriptions sont instables.
posté par Marc Duval, #référence - 16:00



L'ontologie du web

Vous verrez de plus en plus le terme ontologie associé au web sémantique.  Il ne s'agit pas de philosophie mais d'un mot emprunté par les informaticiens pour désigner les relations entre des concepts.  M. Philippe Chartier vient de publier l'article « Un web plus intelligent » dans la revue Québec Science de septembre qui résume bien les travaux.  Voici un extrait:
[...] différents concepteurs de sites peuvent employer différents termes ou étiquettes pour exprimer le même concept.  Et c'est là qu'intervient le rouage le plus ambitieux du Web sémantique.   De vastes dictionnaires appelés des « ontologies » seront chargés de répertorier les équivalences entre termes, de manière à ce que l'on sache que le terme X sur tel site exprime le même concept que le terme Y sur tel autre site.  En principe, ce mécanisme devrait grandement améliorer la précision des moteurs de recherche car, grâce aux ontologies, ils pourront rechercher les pages qui correspondent à un concept donné plutôt que, comme ils le font actuellement, celles qui contiennent simplement les mots-clés particuliers.
L'idée des « ontologies » n'est pas nouvelle.  La bibliothéconomie a développé un outil qui sert à contrôler le vocabulaire qui se nomme le thésaurus.  Plusieurs thésaurus ont été développés.  Le plus commun est le Library of Congress Subject Headings de la Bibliothèque du Congrès à Washington.  La bibliothèque de l'Université Laval a adapté l'ouvrage sous le titre de Répertoire des vedettes matières.   M. Pierre Gascon a écrit un article historique intitulé: « Le Répertoire de vedettes-matière de la Bibliothèque de l'Université Laval : sa genèse et son évolution».

Lorsqu'il sera question d'ontologie dans le contexte du web sémantique, le mot thésaurus devrait être utilisé et le sera dans ce carnet web.
Source:
Philippe Chartier, « Un Web plus intelligent », Québec Science, vol. 43, no 1, septembre 2004, p. 38-40 (voir Cybersciences.  Mise à jour le 30 août pour le numéro de septembre)
Gascon, Pierre. « Le Répertoire de vedettes-matière de la Bibliothèque de l'Université Laval : sa genèse et son évolution », Documentation et bibliothèques, 1993, v. 39, no 3, pp. 129-139 (pour la 1e partie) ; 1994, v. 40, no 1, pp. 25-32 (pour la 2e partie). En ligne. http://www.bibl.ulaval.ca/adele/rvm.pdf

posté par Marc Duval, #référence - 10:37

2004-08-11



Des tableaux météos sur Ask Jeeves

Le site Resource Shelf a révélé un quatrième raccourci pour la météo la semaine dernière.  Après weather, forecast et detailed weather report for, voici climate qui donne le tableau des moyennes mensuelles des données météos.  Les moyennes des précipitations en pluie et en neige sont réservées aux États-Unis. Le raccourci climate peut être placé avant comme après le nom de la ville comme ceci:
climate Montréal
Québec climate
Les raccourcis sont identifiées dans l'encadré météo.  En utilisant l'un, l'internaute à accès aux autres sans avoir à mémoriser tous les raccourcis.

posté par Marc Duval, #référence - 22:50

2004-08-09



IceRocket, métachercheur

Depuis quelques temps, le nom d'IceRocket circule sur le web.  IceRocket est un métachercheur utilisant AltaVista, Alltheweb, Lycos, MSN, Teoma, WiseNut et Yahoo.  Le site est un hybride de Google et de Yahoo!  dans sa forme.  Sa page d'accueil comprend une case de recherche surmontée de cinq onglets de catalogues : web, actualités, images, produits et rencontres.  Sous la case de recherche, il y a une case à cocher pour la recherche d'une expression.  Son formulaire de recherche est semblable à celui de Yahoo!  L'historisation de la recherche est disponible pour chacun des catalogues.  Cette fonction peut être désactivée dans les Préférences.   Le résultat de recherche affiche des vignettes d'Alexa.  Cette fonction peut être désactivée.
En comparaison avec les autres sites de recherche, notons la recherche d'individus et l'historisation de la recherche.
Source:
IceRocket Ready for Liftoff, ClickZnews, 6 août

posté par Marc Duval, #référence - 12:04

2004-08-05



Top 100 d'AOL France

AOL France a ajouté son palmarès des requêtes sur AOL France et sur Netscape France.  Le Top 100 des requêtes combinées est accompagné des 40 requêtes en hausse et en baisse.
posté par Marc Duval, #référence - 15:10

2004-08-03



Pages Jaunes: Ask Jeeves et Yahoo

Ask Jeeves a publié un communiqué annonçant ce qui pourrait être un changement de partenaire pour la recherche dans les pages jaunes.  Il délaisserait SmartPages pour s'associer à CitySearch.  Les inscriptions de CitySearch seraient intégrées aux raccourcis de SmartSearch complétant la recherche dans les pages blanches.
Yahoo! a choisi d'amalgamer trois services dans son nouveau service de recherche Yahoo! Local sur le marché états-unien : Yahoo! Yellow Pages, Yahoo! Maps et Yahoo! Search.  Ce service est à ne pas confondre avec Local Yahoo!s qui sont les sites régionaux.  Selon Yahoo!, il n'est pas prévu d'étendre le service Yahoo! Local aux Local Yahoo!s.  Quelle belle confusion s'annonce avec l'expression recherche locale!  Ce qui ne nous changera guère avec l'expression fourre-tout moteur de recherche!
Yahoo! Local a la particularité de permettre aux internautes d'évaluer un commerce tant par une échelle que par un commentaire.  Les commerces qui ont un site web sont identifiés par [ Web Site ] et leurs inscriptions ont un extrait et un lien vers Yahoo! Maps.
Les inscriptions peuvent être triées par ordre alphabétique, de distance et d'évaluation.  Le résultat de recherche peut être raffiné selon la distance et les rubriques suggérées.
Enfin, l'inscription peut être expédiée par courriel ou enregistrée dans le carnet d'adresse de l'abonné de Yahoo!
Source:
Ask Jeeves Teams With Citysearch to Create Leading Local Search Experience, Ask Jeeves, Communiqué, 3 août
Yahoo Unveils New Local Search Engine, AP, Yahoo! News, 3 août

posté par Marc Duval, #référence - 16:59



Mise à jour de Topix
Le site d'actualités états-unien Topix a renouvelé sa présentation.  Son programme baptisé NewsRank aiguille les articles provenant de plus de 7 000 sources vers un thésaurus de 150 000 sujets parmi lesquels les pays.  Topix comporte aussi un affichage d'actualités locales pour les États-Unis basé sur le code ZIP ou la ville.
Les notices des articles apparaissent sous deux formats.  Le premier format est un classement thématique accompagné d'une photo.  Le second format, Live feed, affiche les titres par ordre d'entrée sans extraits ni photos.  Les articles en date de leur publication sont classés sous 10 rubriques principales, elles-mêmes ramifiées.  Chaque titre peut être envoyé par courriel.  La rubrique Business est divisée en articles journalistiques et en communiqués de presse.
Le module de recherche a un affichage du résultat de recherche différent.  Les notices sont classées par ordre descendant de date et non de pertinence.  Le format d'affichage n'a pas la fonction d'envoi par courriel, mais il inclut les rubriques facilitant les alertes qui ne sont pas créées à partir d'une requête.  En contrepartie, un fil de nouvelles XML est disponible pour les requêtes.  Une case propose des rubriques reliées à la requête.  D'autre part, les liens vers les articles ne sont pas limités à 30 jours comme la plupart de ses concurrents.
Topix est financé par les liens commandités de Google et de FindWhat et par des bannières.
La force de Topix est la profondeur de son classement incluant la présentation locale des actualités; sa faiblesse est son module de recherche par uniterme, sans formulaire, ni préfixes de recherche.
Source:
Topix.net: The best algorithmic news editing in the business, Topic.net Weblog, 1er août.

posté par Marc Duval, #référence - 13:51

2004-08-02



MSN cherchera dans les MI

D'autres pièces du casse-tête de la recherche chez MSN ont été dévoilées.  MSN mettrait à contribution son produit SharePoint (voir le message de DSI du 13 octobre 2003 MSN Search: un automate en devenir).  Il introduirait un gestionnaire de requêtes pour faire correspondre les recherches antérieures à la recherche active.  La recherche serait étendue aux archives des messages instantanés.  Le nombre de notices par pages par défaut serait de 20 comme celui de Yahoo!  Enfin, la case de recherche aurait un affichage permanent quelque soit l'application ouverte.
Tout porte à croire que MSN aurait deux versions de son système de recherche: soit un
utilisant Internet Explorer, indépendant du système d'exploitation qui sortirait avant celui attendu pour 2006 et l'autre intégré au système d'exploitation.
Source:
Search and destroy. "The future of search" and Microsoft, The Boston Globe, 2 août

posté par Marc Duval, #référence - 18:12



Un site pour les soumissionnaires de Google

Google a ouvert une site sécurisé pour informer ses futurs actionnaires : https://www.ipo.google.com/.
Les investisseurs doivent être résidents des États-Unis.  L'enregistrement comporte le code postal (utilisez par exemple 94043) et l'état de résidence (ex.: California).  Google fournit tous les renseignements: le prospectus, une présentation vidéo de l'entreprise par MM. Eric Schmidt, Sergei Brin, Larry Page et Georges Reyes (Directeur financier), la transcription de la présentation vidéo, la demande d'identification du soumissionnaire, les démarches pour ouvrir un compte, des conseils, une page de questions/réponses et l'annonce officielle de son appel public à l'épargne.
Évidemment, l'investisseur aura un petit effort pour monter son dossier sur Google, entre autres ses démêles avec la justice.
Petit fait cocasse: le traducteur de Google est incapable d'accéder au site sécurisé [note: le https: devient le http: ] contrairement au traducteur de Yahoo! On peut dire que la « technologie » de Google est supérieur à ses concurrents!

posté par Marc Duval, #référence - 08:33


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.