DSI. Le carnet des sites de recherche
par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec
Index abrégé du site de DSI :
Les actualités des sites de recherche
Les fiches techniques: AlltheWeb,
AltaVista,
AntiSearch,
Google,
HotBot,
MSN Search,
Northern Light,
Voila - Tout le web francophone
/ Chronique de la recherche
/ Classement des automates de recherche
/ Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
| Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche
|
[Archives] / [Atom] / [RSS]
2004-04-30
Google et Yahoo mettent les actualités en images
Google
et Yahoo ont intégré les images d'actualités à leur recherche d'images. Tandis que Google Images affiche un échantillon d'images d'actualités en première ligne sur le modèle de la recherche de pages web avec un lien vers Google News, Yahoo!
Images intègre toutes les images d'actualités provenant de son réseau sans lien avec Yahoo! News.
D'autre part, la recherche d'images dans les actualités chez Google est étendue à ses interfaces nationales, du moins en français, alors que celle chez Yahoo! est restreinte aux États-Unis pour le moment.
Yahoo! Images ne semble pas être aussi au point que Google Images pour la recherche de photos de John Kerry (John
Kerry sur Yahoo! Images / John
Kerry sur Google Images).
posté par Marc Duval, #référence - 14:52
Ujiko, évaluation rapide
J'ai
comparé Ujiko avec Yahoo! France. Malgré la gestion du résultat de recherche, Ujiko a été décevant. La page d'Ujiko est grande. Vous avez besoin d'un écran d'au moins 21 pouces pour profiter d'Ujiko. Plus petit, vous devez déplacer le curseur.
Les dix requêtes les plus populaires sur Yahoo! France - vendredi 30 avril 2004 - ont été cherchées sur les deux sites de recherche. A chacune des requêtes, Ujiko a trouvé la moitié des pages affichées sur Yahoo! Ceci n'en fait pas un mauvais site de recherche parce que les pages d'accueil des sites correspondant aux requêtes s'affichent en premier et sont identifiées par l'icône d'une page colorée.
Aux requêtes «pages jaunes», «horoscope»,
«meteo», Yahoo affiche un formulaire de recherche pour les pages jaunes et l'horoscope, et le raccourci pour accéder à la météo d'une ville. Ce qui constitue un atout supérieur à la gestion des pages.
Je n'attends plus d'un site de recherche qu'il me donne une liste de pages que je peux gérer. J'attends qu'il me donne la réponse à une question pratique en moins de trois clics d'où qu'elle puisse venir (pages web ou banques de données). Un clic pour la requête, un deuxième pour raffiner la recherche (formulaire de recherche, suggestions de recherche hiérarchiques, aperçu des pages, raccourcis, etc.) et un dernier pour atteindre l'information.
Prenons l'exemple de la requête «thé». Le résultat de recherche n'est pas impressionnant pour aucun des deux. Ujiko ajoute une liste de mots pour raffiner la requête qui n'a aucun rapport avec la boisson. Yahoo! me fournit ses rubriques sur le thé qui ont une plus grande pertinence: certaines sur le commerce et une sur la boisson. Rien
n'étant parfait, Yahoo! a la fâcheuse habitude de ne pas réévaluer les sites de son répertoire et surtout il a retiré son Yahoo! Encyclopédie - bien que Yahoo! France Encyclopédie ait été reléguée dans un recoin de Yahoo!.
Ujiko est un laboratoire de recherche sympatique, un démonstrateur pour sa version commerciale. Il a le mérite de donner des idées aux autres grands de la recherche. Est-ce suffisant pour qu'il devienne populaire sur le web?
posté par Marc Duval, #référence - 12:41
2004-04-29
Google
à la SEC
Google inc. a déposé aujourd'hui son prospectus
donnant ses états financiers à la Security Exchange Commission. Il révèle des revenus de 961,874
M$US en 2003 pour un bénéfice de 105,648 M$US. Durant le premier trimestre de 2004, les revenus se sont élevés à 389,638 M$US avec un bénéfice de 63,973 M$US. Il est prévu d'émettre des actions pour une valeur de
2,718,281,828$US.
Selon
le manuel destiné aux investisseurs, Google n'a pas l'intention de se sacrifier sur l'autel de la rentabilité. La société continuera à investir dans des projets risqués.
Voici
quelques articles traitant du sujet:
Google
Inc. Files Registration Statement with the SEC for an Initial Public
Offering, Google inc, Communiqué, 29 avril
Google en Bourse: c'est parti ! 2,7 milliards à la clé?,
Silicon.fr, 29 avril
La
très attendue entrée en Bourse de Google se fera aux
enchères,
Libération, 29 avril
Google
lève le voile sur une très prometteuse introduction en
Bourse,
AFP, 29 avril
Google files for unusual $2.7 billion IPO,
CNet News, 29 avril
Co-founders
release Google 'owner's manual', CNet News, 29 avril
posté par Marc Duval, #référence - 18:43
Ujiko, un nouveau site de recherche qui flashe
Un nouveau site de recherche vient de voir le jour en terre de France. Il se nomme Ujiko, un jeu de lettres voisines du clavier formant un W.
Ujiko est animé par le logiciel de Flash6 de Macromedia tout comme le méta-chercheur Kartoo, tout deux du même concepteur. Ujiko s'appuie sur Yahoo! Search pour livrer les
résultats de recherche.
L'affichage du résultat de recherche est dans un cadre attrayant, loin de l'affichage épuré d'un Google.
Ujiko a la particularité de permettre la gestion d'un résultat de recherche. Une page peut être jetée à la corbeille, enregistrée comme coup de coeur, classée dans un dossier et notée. Cette gestion réorganise la position des notices.
Ujiko comprend plusieurs filtres qui permettent de retrancher ou de surligner des pages: domaines, sites, url, parentaux.
L'opérateur logique par défaut est AND. Ujiko supporte aussi OR et NOT (-).
Les liens commandités ont l'inscription (sponsor). Ils ne peuvent être retirés du résultat de recherche ni surlignés ; ce qui constitue un irritant compte tenu des filtres existants.
Le résultat de recherche peut être imprimé ou envoyé par courriel
Quelques tests ont révélé que la gestion du résultat de recherche est intéressante. Toutefois, le filtre parental ne semble pas être efficace à première vue.
posté par Marc Duval, #référence - 14:54
2004-04-28
CrossRef, le communiqué
La
semaine dernière j'ai scoopé CrossRef qui vient d'émettre leur communiqué. Le voici en complément :
CrossRef
Launches Pilot Program of CrossRef Search, Powered By Google, Business
Wire, 28 avril.
posté par Marc Duval, #référence - 15:15
2004-04-27
Google en quatre temps
A l'approche des rumeurs insistantes sur l'entrée en bourse de Google en mai, la revue Business Week publie une série d'articles sur Google dans son numéro du 3 mai. Les articles ne révèlent rien mais font le point sur la
compagnie.
Google. Why the world's hottest tech company will struggle to keep its edge
Pourquoi la société de haute technologie la plus à «la page» luttera pour garder sa suprématie. L'auteur compare le modèle commercial d'achat intégré de Yahoo à celui compartimenté de Google.
Google fait face a des assauts de ces concurrents. Tandis que Yahoo prend le pas avec la personnalisation de la recherche, MSN introduit dans sa mise à jour de son logiciel de messagerie l'installation par défaut de sa barre d'outils dans Internet Explorer, facilitant l'accès à ses services, dont celui de la recherche web.*
Google's Goal: "Understand Everything"
Entrevue fade avec Larry Page.
What Eric Schmidt Found at Google
Entrevue avec Eric Schmidt. Selon M. Schmidt, l'innovation vient de l'invention qui ne peut être programmée. Voilà le secret.
Google's Gmail Is Great -- but Not for Privacy
Le service de courriels qui offrira un espace de stockage important prête flancs aux critiques sur la protection de la vie privée.
----------------------
*Le nouveau MSN Messenger s'attaque à Google, Branchez-vous, 25 avril
posté par Marc Duval, #référence - 13:23
2004-04-21
Google
le tout-puissant
Depuis la sortie de GMail, Google alimente des visionnaires. D'aucuns le voient proposer un traitement de texte à sa barre d'outils de fureteur et à sa barre d'outils de bureau - permettant de passer naturellement de la recherche web au texte. Les documents seraient entreposés dans sa batterie de serveurs. De 1Go, l'espace disque de stockage passerait à 100Go. D'autres spéculent sur la vente d'ordinateurs personnels Google avec Linux, logiciels de recherche et de gestion d'information (Google Search Appliance) inclus. Les
heureux propriétaires seraient directement branchés sur le site de Google sans passer par un fureteur - la Google Deskbar.
Ses spéculations viseraient le monopole de Microsoft autant sur le terrain des systèmes d'exploitation que sur celui des logiciels de traitement de l'information et d'accès à Internet.
Source:
Google eyes Net operating system, The Argus, 19 avril.
posté par Marc Duval, #référence - 23:34
Real s'allie à Google
La version 10 de RealPlayer a ajouté à son offre la barre d'outils de Google selon le communiqué de RealNetWorks. Une fonction de RealPlayer permet de charger la barre d'outils. Or, Google n'a pas de catalogue audio-visuel. Cette alliance
permet à Google de combler cette lacune à court terme. Serait-ce le premier pas de Google dans la recherche de documents audio-visuels?
posté par Marc Duval, #référence - 10:17
2004-04-19
CrossRef Search Pilot powered by Google
Google collabore depuis quelques mois au projet pilote CrossRef Search.
CrossRef est un regroupement de 290 éditeurs, 288 bibliothèques et une vingtaine d'entreprises et d'organismes comme les serveurs Dialog et Cambridge Scientific Abstact, l'agence
d'abonnement Ebsco, des fournisseurs de documents comme Ingenta. Ce regroupement constitue le noyau dur du web payant inaccessible aux automates de recherche à moins d'entente. Ce d'aucuns appellent le web invisible. Il a permis à Google d'indexer le contenu intégral des publications de neuf éditeurs dans le cadre du projet pilote. Chaque article reçoit un numéro dans son URL. L'attribution de ce numéro permet une identification unificatrice. En plus d'un système unique d'indentification, chaque article reçoit de l'éditeur des métadonnées permettant une recherche efficace. La revue Nature fait partie de CrossRef. Elle a sur son site le module de recherche
actionné par Google. Finalement, ce projet s'inscrit dans la lignée du web sémantique. Ce n'est que dans des regroupements spécialisés comme CrossRef que le web sémantique peut se réaliser. Dans une moindre mesure, le programme Google Print intègre cette orientation en fichant des articles de périodiques identifiés par [magazine]
à la gauche du titre dans le résultat de recherche; la
description des fiches pouvant être assimilée à des métadonnées.
posté par Marc Duval, #référence - 23:14
Jeeves affiche ses personnalités
Le site de recherche expert Ask Jeeves *** a ajouté officiellement le 13 avril la recherche de célébrités en collaboration avec le site biographique Who2. L'extrait encadré de la notice biographique est accompagné d'une photo provenant du web.
Ask Jeeves a choisi un partenaire mineur. Les biographies de Who2 sont limitées à quelques 2 200 entrées comparativement au site biographie.net avec près de 25 000 entrées dont plus de 5 800 en français.
Parmi les premiers ministres canadiens, Jean Chrétien et Pierre Trudeau sont dans Who2. Mais pas Brian Mulroney ni Paul Martin... ni paradoxalement
Pierre Élliott Trudeau - alias Pierre Trudeau ci-devant cité - qui fait un pied de nez à la renommée de Ask Jeeves en tant que moteur de recherche en langage naturel. Jacques Chirac, Jean-Marie Le Pen et Charles de Gaule ont leur entrée. Le grand hockeyeur Wayne Gretzki - mais non Gretzki seul - a sa biographie mais pas le célèbre Maurice Richard, ni Louis Lumière... mais Louis Lumiére est dans Who2 ignoré par Jeeves quelque soit l'orthographe. Moralité: mieux vaut chercher dans Who2 qu'avec Jeeves. Malgré ces lacunes, ce n'est pas un handicap grâce aux recherches liés d'Ask Jeeves, sinon avec une meilleure requête.
Ask Jeeves aurait pu choisir un partenaire d'envergure par exemple Infoplease. Ask Jeeves et Infoplease sont complémentaires. Leur alliance aurait eu plus d'impact que celle avec Who2. L'entrée de plus en plus intrusive de la publicité dans les résultats des automates de recherche les rendent de moins en moins pertinents. C'est pourquoi une alliance avec des sites encyclopédiques est stratégique. MSN a une longueur d'avance sur ce terrain avec Encarta. Yahoo a tous les outils qu'il faut à condition qu'il sache en tirer partie. Wikipédia et Google (ou Nutch - à venir) feraient bonne équipe. Le hic! est que tous ont la publicité commerciale - maintenant locale - dans le collimateur. Au lieu de voir de l'amélioration, nous sommes témoins de la détérioration avec le retrait
de plusieurs fonctions et préfixes de recherche d'AltaVista et d'AlltheWeb, notamment.
***Le noyau d'Ask Jeeves est une banque de données de connaissance de type «questions/réponses»; ce qui lui donne l'apparence d'un moteur de recherche en langage naturel.
posté par Marc Duval, #référence - 20:56
2004-04-18
Amazon lance A9
Le
cyber-libraire a lancé un site de recherche appelé A9 en phase d'essai mercredi 14 avril. La page de tons de beige est sobre. Elle ne comprend qu'une boîte de recherche sans aucune fonction, aucun formulaire comme Amazon ou Google.
Ce service de recherche a pour but d'intégrer la recherche web au site commercial web. Il utilise la banque de données de Google.com couplée à deux logiciels. Le premier - A9 - fait un lien entre une page web de Google à la banque de données des produits d'Amazon.com : livres, musique, électronique, etc. Le second relie la page web a des données statistiques recueillis par la société
Alexa, filiale d'Amazon. Cette fonction est illustrée par la cartouche site info à la fin de chaque notice du résultat de recherche web.
A9 est intimement et uniquement relié à Amazon.com. Il ne dessert pas encore la clientèle canadienne, française ou britannique.
Le résultat de recherche de A9 est particulier. Il est constitué de trois sections identifiés par des onglets donnant l'impression de signets de livres. La première section est le résultat web fourni par Google et encadré par les liens publicitaires de Google. La
deuxième est le résultat provenant d'Amazon lorsque la requête porte sur un produit de son catalogue. S'il s'agit d'un livre, l'abonné à Amazon aura droit à la fonction de recherche Search inside the book. La troisième section est l'historique de la recherche pour
l'abonné à Amazon. Cette dernière fonction est la reprise de celle sur le site même d'Amazon. L'abonné peut
«éditer» l'historique pour supprimer des recherches. Trois jours après la sortie de A9, elle n'était pas encore active. Les sections peuvent être ouvertes en cliquant sur les onglets ou en réglant les divisions. Elles forment alors trois colonnes pouvant être
fermées à gauche ou à droite. Enfin, l'internaute peut lancer une recherche à partir de la barre d'adresse d'Internet Explorer en utilisant une requête sous cette forme www.a9.com/requête
Il va de soi que le service offre une barre d'outils pour Internet Explorer. On y retrouve les fonctions habituelles: module de recherche, mise en évidence des termes de recherche et bloqueur de fenêtres-pubs. Le module de recherche a trois sections : la recherche traditionnelle sur le web, sur le site et sur la page; la recherche sur les produits en général ou en particulier d'Amazon, et la recherche dans quatre services: Google, le dictionnaire général Merriam-Webster et à son dictionnaire des synonymes, et à la banque de données cinématographiques IMDb. A9 ajoute trois fonctions de son crû pour les abonnés d'Amazon : l'historique, le carnet (diary) et l'info-site. Le carnet sert à annoter la recherche. Précisons que les internautes qui utilisent cette barre d'outils est reliée à Alexa. Par conséquent, ils participent aux statistiques de l'info-site.
En lançant son propre service de recherche en marge de son propre site, Amazon entre en concurrence avec Yahoo! et Google. Amazon compte lancer A9 sur le marché des fournisseurs de service de recherche. Il ne lui restera plus qu'à laisser Google pour boucler la boucle. Yahoo! a
défriché le chemin. MSN suivra. Que fera AOL devant les prétentions de Google?
Articles reliés:
Amazon
lève le voile sur son moteur de recherche A9 , ZDNet France, 16 avril
A9,
nouvelle arme d'Amazon, LCI, 16 avril
Mise à jour 20 avril: L'historique de la recherche est particulièrement utile. Elle comprend la liste des pages visitées hyperliées et la liste des requêtes aussi hyperliées. Chaque élément de chacune des listes peut être supprimé. Les listes des requêtes sont divisées en dossiers selon les jours de recherche. Il lui manque les alertes pour que cette fonction soit indispensable.
A9 est intégré à Amazon avec l'historique de la recherche mais il est moins pratique. La recherche dans les produits d'Amazon est sur une autre page plutôt qu'intégrée à la page de recherche. Votre dossier de recherche vous suit d'Amazone vers A9 et vice versa.
Mentionnons aussi la note [New result] à la fin gauche de l'adresse web des notices. Cette note changera en [ Clicked 2 days ago ] par exemple pour vous signalez que vous avez visité la page. Enfin, utilisez l'adresse http://generic.a9.com si vous êtes réfractaires aux fichiers témoins.
Source: Help, A9.com
posté par Marc Duval, #référence - 16:24
2004-04-13
Un moteur de l 'info voit le jour
Un nouveau site de recherche d'actualités est en formation. Le moteur de l'info est l'oeuvre de M. Gilles D'Elia de Gunix.org. Il comprend neuf thèmes : A la une, International, France, Économie, Multimédia, Science/Tech, Sports, Culture et Santé.
La banque de données est limitée. Le site n'a ni formulaire de recherche ni tri par dates. En revanche, certains titres ont une photo.
Le projet du Moteur de l'info est d'archiver les actualités contrairement à Google qui les garde deux mois. Il est prévu d'être opérationnel au début de l'été.
Source:
Un moteur
de recherches d’informations francophones en développement
à Nice in Le journal de Nice, 15 mars 2004.
posté par Marc Duval, #référence - 00:30
Les enjeux culturels des moteurs de recherche
La
Bibliothèque publique d'information du Centre Georges Pompidou vient d'ouvrir un lieu public consacré aux débats culturels. La première conférence traite des Les enjeux culturels des moteurs de recherche. Le dossier qui en a résulté comprend cinq interventions: Les systèmes techniques des moteurs de recherche, Les sources de revenus de Google et son modèle économique , Google. Une
enquête. , Google et la
bibliothèque : quelle autonomie pour l’usager ? ,
Logiques
d’enquêtes et moteurs de (la) recherche , Chacune d'entre ont un résumé et son enregistrement MP3. L'intervention sur l'enquête de Google est la plus intéressante. Le conférencier donne deux pistes de recherche : l'indexation distribuée et le partage des données. En complément d'information le projet
d'indexation distribuée est représenté par Grub et celui de partage de
données par Human
Links.
posté par Marc Duval, #référence - 00:02
2004-04-08
Google en manchettes, Inktomi avance
Depuis un mois, Yahoo est dans les grandes manoeuvres en avançant sa tour Inktomi. Après les sites AlltheWeb puis AltaVista, il remplace petit à petit les portails qui avaient AlltheWeb comme Lycos, Tiscali Recherche (Nomade), Excite Europe. Yahoo! essaie d'encercler Google. Aussi, la banque d'images est la même pour Yahoo!, AltaVista, AlltheWeb et Excite
Europe.
Du côté de Google, il semble qu'il y ait des ratés avec son service de courriels GMail. Google prévoit financer ce service en intégrant de la publicité ciblée; ce qui mettrait en péril la vie privée. D'autre part, sa marque de commerce est contestée par une entreprise britannique. De l'autre, son offre de 1Go d'archivage est contestée parce que les messages ne pourraient être effacés. Qu'à cela ne tienne, le site SpyMac a déjà relancé Google à 1Go sans publicité dans les courriels.
Sources:
Un
site concurrence Google en offrant un compte de courriel gratuit de 1000 Mo, Branchez-vous, 6 avril.
Gmail:
plus difficile que prévu, Journal Les Affaires, 8 avril
posté par Marc Duval, #référence - 23:05
2004-04-02
AltaVista passe à Inktomi
AltaVista
est passé à la moulinette de Yahoo après AlltheWeb. HotBot étant l'étalon de mesure, les trois sites de recherche ont Inktomi alors que Yahoo! a une banque de données beaucoup plus développée.
Le langage de recherche spécifique à AltaVista a été changé par celui de Yahoo! Search Technology. Ainsi, AltaVista a perdu quatre préfixes de recherche: anchor:, applet:, like:. text: et image:. , les
opérateurs NEAR et de troncature. L'opérateur d'exclusion AND NOT est remplacé par NOT dans le formulaire de recherche, mais demeure dans le tableau de la recherche avancée. De plus, sa fonction de tri a été retirée.
Sa liste des suffixes de domaines a été retirée du formulaire. Les types de formats sont identiques à AlltheWeb: PDF, Microsoft Word, Microsoft Excel (.xls), Microsoft Power Point (.ppt), HTML et Text (.txt). AlltheWeb garde l'exclusivité de Macromedia Flash (.swf).
AltaVista demeure sensible aux accents. Cependant son système Prisma est remplacé par celui des Recherches associées qui se désactive lorsque la requête est écrite en capitales. Bien que les parenthèses pour les requêtes complexes aient été retirés du tableau de la recherche avancée, elles demeurent actives du moins pour le moment.
Il ne semble pas y avoir eu pour le moment de fusion entre les banques de données, mais un remplacement par celle d'Inktomi. Avec le retrait des langages de recherche d'AltaVista et d'AlltheWeb qui étaient plus avancés que celui de Google, cela constitue une grande perte.
posté par Marc Duval, #référence - 01:38
2004-04-01
Google sur la lune
Google
a l'intention d'ouvrir un centre de recherche sur la lune en 2007.
Plus tôt, les États-Unis et la Chine avaient lancé leur intention l'un de revenir sur l'astre lunaire et l'autre de s'y établir. Google les devance. La société a déjà commencé à engager des informaticiens et des techniciens pour son Centre Copernic. Leur but est «d'organiser toute l'information utile dans l'univers et de vous la servir sur un craquelin légèrement salé.»
Le programme complet de cet ambitieux projet est disponible sur la page d'offres d'emploi du Centre
Copernic de Google.
posté par Marc Duval, #référence - 07:10
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un
ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.