DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec


Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

[Archives] / [Atom] / [RSS]

2003-01-30



Google unie

Google identifie comme connecteurs d'expression le tiret ( - ), la barre oblique standard ( / ), le point ( . ) et le signe égal ( = ) à côté de l'opérateur de proximité officiel, les guillemets anglais.  Or j'ai remarqué que lorsqu'il y a plus de deux expressions, Google remplace les guillemets par le tiret.  Pourquoi s'embêter à mettre des guillemets au risque d'en oublier un, alors que le tiret fait tout aussi bien le travail.  Si vous recherchez un nom propre comme George W Bush, la requête devient George-W-Bush.
posté par Marc Duval, #référence - 23:14

2003-01-29



Enfin.com en péril

L'auteur du répertoire spécialisé en outils de recherche Enfin et du bulletin Moteurzine lance un cri d'alarme.  Au fil des ans, ces deux sites ont su se démarquer, le premier par son dynamisme et le second par les entrevues des grands noms du domaine.  Le dernier numéro du bulletin nous apprend dans une entrevue avec Tim Mayer qu'AlltheWeb pourrait mettre en ligne sa barre d'outils.
Les sites de qualité en français sont rares en comparaison avec ceux en anglais.  Pour la plupart d'entre eux, les auteurs ont pris le bâton du pellerin et le pari de la gratuité.  Plus le temps passe, plus le gratuit devient un boulet en mettant en danger la survie du site.  Je vous invite à encourager l'un d'entre nous en le visitant et en participant à son forum.  Si par bonheur vous avez quelques sous à investir, n'hésitez pas.

posté par Marc Duval, #référence - 20:59



Nomade lance un nouveau répertoire

Nomade vient de lancer un nouveau répertoire: Nomade pro.  Il s'agit du même site que Nomade général dans lequel les sites professionnels ont été regroupés.  Je suis sceptique quant à la pertinence d'un tel duplicata.  Je vois davantage une stratégie pour engranger de l'argent provenant de la soumission de site payante.
posté par Marc Duval, #référence - 12:29



Google au Paraguay

Google vient d'ajouter le Paraguay à son tableau.  Recherche en espagnol et dans le pays.
posté par Marc Duval, #référence - 00:23

2003-01-28



La veillée de la veille?

La veille en tant que culture d'entreprise est-elle une chimère?  C'est ce que laisse transparaître 2 indices.  Le premier est l'intérêt de plus en plus faible du groupe de discussion «Veille» sur Yahoo! France.   Ce groupe a été ouvert en 1998.    En 1998, la moyenne des contributions était de 234 par mois; en 1999, elle était de 308; en 2000, de 272; en 2001, de 291; et en 2002, elle est tombée à 115.  Le déclin a commencé en mars 2001.
Le second indice est un sondage québécois - Sondage NETendances 2002 - Utilisation d’Internet au Québec - publié par le Centre francophone d'informatisation des organisations, le CEFRIO, le 24 janvier.  Elle révèle des données étonnantes en regard de la présence du concept de la veille depuis 10 ans au moins au Québec.  Au  chapitre du «type de sites visités pour le travail», on y décèle une baisse. Voici un extrait de l'analyse:

«À l’instar de 2001, la situation a quelque peu fluctué en cours d’année. Par exemple, les sites d’informations / actualités étaient beaucoup plus populaires en mai 2002 (fréquentés par 34,0 % des travailleurs internautes) qu’en août 2002 (24,2 %). Par ailleurs, les sites gouvernementaux ont vu leur popularité chuter en 2002. Fréquentés par 34,0 % des travailleurs québécois internautes en février 2002, ils étaient consultés par 21,1 % d’entre eux en novembre 2002». (page 21)

La donnée la plus étonnante est celle de la visite des «sites de concurrents» qui ne représente que 6%.  Cela porte à croire que le concept de la «veille» en tant que culture d'entreprise ne semble pas avoir réussi à s'imposer au Québec bien qu'il y ait une légère augmentation des heures passées sur Internet.  La corrélation entre la  pertinence mitigée des sites visités et la hausse des heures sur Internet laisse perplexe les employeurs (page 22).
Ce sondage étant omnibus, les résultats de l'utilisation d'Internet dans le cadre du travail sont partiels.  Ils peuvent témoigner d'une tendance, du moins amener une réflexion.

posté par Marc Duval, #référence - 23:47

2003-01-27



Avis de recherche

Deepindex et Kartoo se sont lancés dans les avis de recherche d'enfants disparus.  Chez Kartoo, l'avis de recherche apparaît avec une photo durant le temps de la recherche variable selon la requête.  Chez Deepindex, l'avis est accompagné d'un lien.  Les deux affichent l'avis d'Estelle, 9 ans.
posté par Marc Duval, #référence - 23:09



Google en désordre

- J'ai trouvé un site «googlein» amusant. Les pages reproduisent celles de Google avec des jeux de caractères comme un message composé de lettres découpées.
- Porto Rico a été ajouté à ses interfaces nationaux le 22 janvier.
-Aaron Swartz de Google Weblog a sorti un module de recherche nommé Googler.  Il fonctionne avec des préfixes pour l'accès aux trois catalogues de Google - web, images et actualités.  Gadget.
- Un autre site, Googlert, propose une alerte dont le résultat est envoyé par courriel.
posté par Marc Duval, #référence - 23:01

2003-01-26



Ask Jeeves et le SuperBowl

Le majordome du site Ask Jeeves a revêtu son costume de juge.  En déplaçant le curseur sur Jeeves, ce dernier lève les bras; en cliquant dessus, il renvoie vers des références tout comme Google le fait pour certains évènements.  Dans ce créneau, Google vient de se faire damer le pion.
posté par Marc Duval, #référence - 09:29

2003-01-24



Réactions à reacteur.com

M. Olivier Andrieu du site Abondance a lancé un laboratoire de recherche sur les fonctions d'un automate de recherche.  Ce site s'appelle Reacteur.  Les premières fonctions à être testées sont les statistiques, le dictionnaire, les «expressions connexes» et les synonymes.
AlltheWeb est l'automate choisi pour appliquer les fonctions.  Celles-ci sont des fonctions qui ne sont pas rattachées à AlltheWeb comme peuvent l'être celles des laboratoires de Google.
Les statistiques n'ont peu d'intérêt pour une requête de plus de deux mots.  La formulation - ce mot clé a été demandé - est appliquée sans égard au nombre de mots.  Est-ce que les statistiques s'appliquent au premier, au second mot ou aux deux?
Le dictionnaire est sans originalité.  Il est déjà sur Google.  Il démontre qu'il peut être mis en complément avec un automate, ce que j'ai toujours pensé.  Il faisait d'ailleurs parti d'un critère d'évaluation de mes analyses.  Le dictionnaire fonctionne avec un mot, ce qui n'est pas très pratique.  L'idée de Google d'hyperlier les mots d'une requête vers les définitions auraient pu être empruntée et améliorée.  Le lien vers Mediadico amène l'internaute vers un formulaire et non vers d'autres définitions ou synonymes.
La seule fonction intéressante est le dictionnaire des synonymes.  Comme il se réfère encore à Mediadico, elle demeure mitigée.
«Expressions connexes» est un petit bijou qui pourraient faire partie d'un bêtisier.  En fait il s'agit d'une liste de requêtes provenant des interrogations des internautes.  A «test», une expression connexe est «testostérone»,  à «idée» il y a «orchidée», à «champ» apparaît «champignon», à «moteur» il y a «promoteur».
Je suis déçu de cette première sortie.  Je me serais attendu à mieux, du moins une amélioration des fonctions existantes chez d'autres sites de recherche.
Quoiqu'il en soit, c'est une initiative à souligner.

posté par Marc Duval, #référence - 13:44

2003-01-22



Teoma - HotBot

HotBot annonce dans l'aide du site l'arrivée du formulaire de recherche de Teoma.
D'autre part, une nouvelle formulation de recherche est incluse dans le formulaire - «not exact phrase» - pour exclure une expression.

posté par Marc Duval, #référence - 20:13

2003-01-21



Teoma, version 2.0

Nous avons assisté le 15 janvier au lancement de la version 2.0 de Teoma.  Cette nouvelle version inclut un vérificateur orthographique (Spell check Technology), le format kwic (Dynamic Descriptions), un formulaire de recherche et la recherche booléenne, et une banque de données de 500 millions d'adresses sélectionnées à partir d'un milliard d'URL.  Au cours du printemps et de l'été, Teoma verra l'augmentation de cette banque. De nouvelles fonctions sont aussi sur la table de travail et arriveront au courant de l'année.
Fait cocasse, les liens commandités sont fournis par Google, son concurrent.

posté par Marc Duval, #référence - 16:10



Les grandes opérations d'AlltheWeb

AlltheWeb vient d'ajouter de nouveaux outils de recherche, soit l'ajout d'AlltheWeb dans les sites de recherche de votre fureteur.  Par exemple, pour Netscape/Mozilla, AlltheWeb est ajouté à la barre latérale, en bouton de recherche dans la barre personnelle ou au site de recherche par défaut dans la barre d'adresse.
Tout comme Google, AlltheWeb reconnaît automatiquement la langue de votre fureteur.  Elle apparaîtra dans le formulaire de recherche sous la partie «Language».  La case de gauche aura le libellé «prefered» suivi de la langue selon le code ISO. Vous pouvez changer la langue de la recherche en modifiant cette fonction dans les «préférences».
De nouveaux opérateurs apparaissent. AND (et), OR (ou), ANDNOT (sauf) et RANK (tri).  RANK est un opérateur de tri semblable à la fonction de tri d'AltaVista.  Le mot suivant «rank» apparaîtra de «préférence» parmi les premiers.
La recherche par «expression booléen» est ajoutée à la liste déroulante des opérateurs en libellé.
Les préfixes de recherche sont simplifiés. «normal.title» est remplacé par «title», «url.all» par «url», «link.all» par «link».  Trois nouveaux sont officiellement introduits: «site:», «language», «filezise» et «filetype».
Enfin, deux opérateurs ont été créés pour accompagnés le préfixe «site»: l'opérateur d'union inclusif représenté par l'astérisque «*» et l'opérateur exclusif par l'accent circonflexe «^».
L'opérateur d'union inclusif  est placé à la fin du nom de l'hôte et trouvera tous les noms de domaines dans lequel figure celui de la requête.  Par exemple: dsi site:dsi.com* trouvera le mot «dsi» dans tous les sites dont l'hôte contient la requête «dsi.com».
L'opérateur exclusif est placé avant le nom de l'hôte et trouvera seulement et uniquement le nom de domaine de la requête.  Par exemple: dsi site:^www.dsi-info.ca trouvera exclusivement toutes les pages contenant la requête «dsi» dans le site «www.dsi-info.ca».

posté par Marc Duval, #référence - 03:44

2003-01-20



Bon voyage! de Google

Google inc. a lancé un feuillet publicitaire sur ses sites en anglais avec la phrase «Take your search further. Take a Google Tour.»  Le feuillet vante ses services: la barre d'outils, les groupes de discussions, les actualités, la recherche d'images, le catalogue, la recherche de produits, le fonction «J'ai de la chance» et la page des services et outils.  Il termine par un «Bon Voyage!».
C'est la première fois que Google inc. sent le besoin de mettre de l'avant ses services.  Auparavant, il faisait des liens vers ses nouveaux services sur sa page d'accueil ou à l'intérieur de son site sans vraiment les promouvoir. S'il veut vraiment promouvoir son catalogue et Froogle, ses services «commerciaux», il devrait mettre un lien sur sa page d'accueil comme les autres services.
Google sentirait-il le souffle de ses concurrents?

posté par Marc Duval, #référence - 09:37

2003-01-15



Teoma: les préfixes de recherche

Teoma a maintenant des opérateurs booléens et des préfixes de recherche.  Le trait d'union est assimilé aux guillemets anglais. Voici la liste:
Opérateurs
Signification
Champs
Préfixes
AND / +
Intersection
Titre
intitle:dsi
OR
Union
URL
inurl:dsi
-
Exclusion
Domaine
site:ca
"mot mot"
proximité
Site
site:www.dsi-info.ca
mot-mot
proximité
Région
geoloc:northamerica ; geoloc:NA


Langue
lang:french ; lang:fr


Date
last:Xmonths ; afterdate:aaaammjj ; beforedate:aaaammmjj ; betweendate:aaaammjj,aaaammjj

posté par Marc Duval, #référence - 20:00



Teoma: Le formulaire

Le formulaire de recherche de Teoma est apparu à cette adresse : http://s.teoma.com/AdvancedSearch, mais n'est pas encore lié à sa page d'accueil.  Comme il peut disparaître, voici une copie d'écran de ce formulaire.
Ce formulaire est déjà plus développé que la première version de Google.  Il se rapproche du formulaire de AlltheWeb.  Comme AlltheWeb, la partie booléenne est extensible.  Il recherche dans 10 langues: Allemand, anglais, danois, espagnol, français, italien, néerlandais, norvégien, portugais et suédois.  Les champs de recherche sont : la page, le titre, l'URL, le domaine de tête, le site, les zones géographiques (Afrique, Amérique central, Amérique du Nord, Amérique du Sud, Asie/Inde,  Asie du Sud-est, Europe, Moyen Orient et Océanie).  Sa recherche par date est par périodes fixes (de 1 semaine à 2 ans) et par intervalles couvrant jusqu'en 1980.
Les nombres de références par pages sont 10, 20, 30, 50 et 100.  Il ne lui manque que la recherche avec hyperlien et par type de documents.
Mise à jour: Le lien vers le formulaire de recherche vient d'être ajouté à la page d'accueil avec un lien vers les «préférences».

posté par Marc Duval, #référence - 09:01



Google à Hong Kong

Google vient d'ajouter le drapeau de Hong Kong à son tableau des outils linguistiques.  Ce qui lui donne 43 interfaces nationales.
posté par Marc Duval, #référence - 00:21

2003-01-14



Teoma: Formulaire de recherche attendu

Teoma a publié puis retiré de son plan du site trois rubriques: Advanced Search Tips, Preference Tips et Search FAQ.  Plus tôt en 2002, Greg Notess avait révélé des préfixes de recherche.  Teoma semble se préparer à dévoiler son formulaire de recherche.
posté par Marc Duval, #référence - 16:21



Classement eStat-@position

Le classement eStat-@position de décembre vient de paraître.  Rien de nouveau à l'horizon, Google domine avec 55% du trafic en hausse.  Combiné avec Yahoo! et AOL, cela représente près de 70%.
L'analyse de 1000 requêtes donnent le pouls des internautes pour 2002.  14% des requêtes relèvent de la vie pratique: trafic, météo, calcul d'itinéraires.  Après avoir pris ces renseignements, l'internaute choisit ses destinations vacances.  S'il n'a pas les moyens, il rêvera devant un fond d'écran et se rabattra sur des logiciels gratuits, à moins qu'il ne visite les sites de charmes.  Ses enfants rechercheront leurs idoles.  Enfin, certains s'informeront sur les sites d'actualités.

posté par Marc Duval, #référence - 15:41



Le siège de Google

Business Week a publié une analyse sur Google inc. : Google's Gaggle of Problems.  Le brillant de Google a commencé à se ternir en 2002 avec l'achat d'Inktomi par Yahoo!  Une fronde des petits et moyens portails couverait en raison du trop grand achalandage sur le site même de Google.  L'avenir de Google se jouera cette année.
posté par Marc Duval, #référence - 10:38



Web sémantique

Un intéressant article a paru sur le développement du web: The "Semantic Web” – a future "Mecca” for people searching for information on the Internet?  IBM travaille sur un projet d'automate baptisé «Grand central station».  L'automate ferait des recherches à partir de documents HTML convertis en format XML.  Pour que le web sémantique existe, il faudrait que les automates aient leur propre convertisseur de formats.  Il est irréaliste de croire que les éditeurs de plusieurs milliards de pages du web fassent cette conversion.
posté par Marc Duval, #référence - 10:35

2003-01-13



Northern Light ferme 2 services

La société divine inc. a fermé les services d'alerte et la banque de données d'articles (Special collection) de Northern Light  depuis le 1er janvier.  Il est étonnant de voir la fermeture d'un service payant qui devient de plus en plus la norme sur le web.  Il fallait sans doute s'en attendre; divine inc. avait déjà arrêté ce service avec Yahoo!  Depuis l'achat de Northern Light par divine, inc.,  le site de NL rapetisse comme une peau de chagrin.  Avec l'achat d'Inktomi par Yahoo!, MSN, qui utilise Inktomi, pourrait être tenté d'avoir son propre automate.  Northern Light pourrait être la solution pour MSN et coûterait sans doute moins cher qu'un Google, hypothèse soulevée par Paul McCarney et Matt Kain d'australia.internet.com.
posté par Marc Duval, #référence - 19:52

2003-01-12



Yahoo/ Revue du mois de décembre

9 décembre - Les News du Net, répertoire et actualités des sites répertoriés. 11 décembre - Entrée de Google Viewer - Serait-ce un signe qu'il est là pour rester? Google Webquotes n'a pas encore été répertortié par Yahoo.
13 décembre - Yahoo! change la présentation de sa page des nouveautés.
16 décembre - Search Info, nouveau répertoire marchand.
27 décembre - Mirago, automate de recherche pour la France.  Il comprend une formulaire de recherche thématique, un formulaire de recherche avancée et une page de préférences.
posté par Marc Duval, #référence - 23:43



Search King poursuit Google

Search King, le référenceur états-unien qui a vu ses sites déclasser volontairement par Google inc., intente une poursuite  contre Google par principe puisque son classement a été  rétabli en décembre 2002.  Search King a déposé son dossier sur son site.  Un don est demandé pour le consulter.
posté par Marc Duval, #référence - 23:41



Vivisimo en allemand

Le métachercheur Vivisimo a ouvert un site en allemand.  Ce site constitue sa carte de visite pour le marché européen.
posté par Marc Duval, #référence - 23:36

2003-01-08



Copernic à la croisée des chemins

Le journal Les Affaires du 28 décembre a titré un article «Copernic joue quitte ou double dans le monde des logiciels».  Selon cet article, Copernic a vu ses ventes de son métachercheur stagné en raison de Google.  A mon avis, s'il stagne c'est en raison du modèle utilisé.  L'entreprise s'entête à ne pas développer un formulaire de recherche avancée pour les automates et à ne pas adapter ses opérateurs de recherche à des sites comme Hoovers. Il en résulte que le métachercheur passe à côté d'articles  importants.  Pourtant d'autres métachercheurs s'y emploient comme Kartoo, Fazzle et Vivisimo.  Copernic inc. dirige maintenant ses efforts vers le marché des entreprises déjà bien occupé. Bonne chance, Copernic !
posté par Marc Duval, #référence - 13:00



Search Online devient Fazzle

Search Online a changé de nom pour devenir Fazzle en novembre.  La nouvelle adresse est «http://www.fazzle.com».  Le site a gardé son ancienne adresse avec redirection.  Le changement est le résultat de la confusion du domaine «info» selon ses clients.
posté par Marc Duval, #référence - 12:59

2003-01-06



Google à 10 milliards

Selon l'article «Difficulty getting listed frustrates fans of Google», Sergei Brin espère que Google atteindra les 10 milliards d'adresses en 2003.  Le défi est lancé.
posté par Marc Duval, #référence - 14:49

2003-01-03



Revue de l'année 2002

La revue de l'année 2002 des sites de recherche vient d'être publiée sous le titre 2002: l'année de la consolidation.  Elle brosse un portrait du monde des sites de recherche à partir des Brèves de DSI.
posté par Marc Duval, #référence - 17:05



Google se prépare à entrer en bourse

Les rumeurs d'entrer en bourse, alimentées par une prédiction de M. Rich Karlgaard de Forbes, avaient repris en fin d'année 2002.  Cette fois-ci, la société Google inc. vient de publier les 10 raisons pour venir travailler chez elle.  Parmi elles, la septième est une option d'achat d'actions «pré-IPO».  Elle a aussi publié son programme d'avantages sociaux pour attirer les candidats.  Elle cible les finissants universitaires.
posté par Marc Duval, #référence - 00:04



AlltheWeb étend ses formats de documents

AlltheWeb indexe des documents «rtf».  Il est trouvé avec le préfixe «filetype:».  Ce type de document s'ajoute à celui «txt» qui ne sont pas encore inclus officiellement dans la liste.  Le format «txt» n'est pas identifié avec le préfixe.
posté par Marc Duval, #référence - 00:03


This page is powered by Blogger. Isn't yours?
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.