DSI. Le carnet des sites de recherche
par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec
Index abrégé du site de DSI :
Les actualités des sites de recherche
Les fiches techniques: AlltheWeb,
AltaVista,
AntiSearch,
Google,
HotBot,
MSN Search,
Northern Light,
Voila - Tout le web francophone
/ Chronique de la recherche
/ Classement des automates de recherche
/ Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
| Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche
|
[Archives] / [Atom] / [RSS]
2004-06-29
Gigablast atteint le demi-milliard de pages
Gigablast a atteint aujourd'hui le demi-milliard de pages web indexées. Cette nouvelle étape donne à Gigablast un poids supplémentaire face à ses grands concurrents bien que l'automate de recherche soit encore mineur. Le milliard de pages devrait être atteint d'ici à la fin de l'année.
Gigablast est à considérer sérieusement d'autant que sa banque de données n'est pas encore saturée de bruit (pages indésirables et non pertinentes). Le créateur M. Matt Wells devrait filtrer toutes les pages provenant des autres services de recherche (MSN Search, Blogolist, ODP...) qui n'apportent rien au chercheur. Si nous désirons avoir le résultat de recherche des concurrents, autant s'y rendre ou utiliser un métachercheur plus efficace. Déjà, Gigablast a des liens vers quelques-uns d'entre eux (Google Yahoo, AlltheWeb, DMoz (ODP), AltaVista, Teoma et WiseNut). Pourquoi diminuer la pertinence d'une recherche en étant infiltrer par des intrus comme le fait Google et Yahoo?
posté par Marc Duval, #référence - 11:01
2004-06-28
MSN Search à la conquête du web en juillet
C'est en juillet que Microsoft lancera son automate de recherche sur son portail MSN à la conquête du Web. C'est du moins ce que prétend Bill Gates dans l'article Microsoft prepares for search assault de ZDNet Australia.
Cette annonce correspond à quelques jours près à celle du journal belge La vie du Net ( MSN vise le portefeuille ) du 6 décembre 2003 selon laquelle MSN lancerait son automate en juin.
D'après l'article de ZDNet Australie, MSN Search de juillet remplacerait Inktomi de Yahoo! Il serait lancé en test pour atteindre ses pleines capacités à la fin de l'année. C'est sans doute en janvier 2005 que le nouvel automate de recherche de MSN Search serait déployé mondialement.
Le nouvel automate de MSN Search ferait faire un saut à la recherche tout aussi grand que le fût celui de Google en intégrant l'analyse sémantique. Il comprendrait la personnalisation et la localisation de la recherche déjà en germe chez ses concurrents Google et Yahoo. La recherche dans des bases de données ferait partie de son arsenal.
Est-ce que l'analyse sémantique pourra être adaptée aux autres langues que l'anglais ? Si cette annonce s'avère, le scepticisme est de rigueur.
Les automates de recherche ont besoin d'apprendre à faire des entrevues de référence s'ils veulent remplacer les bibliothécaires. Qui sait? Peut-être y approchons-nous avec la personnalisation, les recherches reliées ou associées, les suggestions de recherche et autres outils d'aide à la recherche!
Enfin, espérons que le nouvel MSN Search épurera le résultat de recherche de la spamindexation, de liens morts et autres pollueurs de listes.
posté par Marc Duval, #référence - 12:57
2004-06-27
Exalead met des vignettes sur Netscape France
Les vignettes des pages web sont apparues sur le résultat de recherche d'Exalead du site de Netscape France (exemple). Trois formats d'affichage sont proposés: la liste du résultat de recherche sans vignettes, avec vignettes et vignettes seulement. Le format par défaut est la liste des notices en kwic (extrait) avec vignettes. Le changement d'affichage s'opère en cliquant sur un idéogramme à l'extrême droite de la barre du nombre de notices.
Les vignettes n'étaient pas encore disponibles sur AOL France au moment de la consultation.
posté par Marc Duval, #référence - 00:05
2004-06-22
AlltheWeb raffine plus et moins
La fonction de raffinement de recherche est maintenant disponible chez AlltheWeb. Elle se trouve en bannière en haut du résultat de recherche. Chaque terme de recherche est accompagné d'un plus et d'un moins servant à l'ajouter ou à le retirer.
Yahoo et AltaVista reprennent la liste des requête dites reliées. Ces requêtes reliées servent à refaire une recherche sans option de retrait.
posté par Marc Duval, #référence - 13:23
Yahoo! change de modèle en Chine
Yahoo a déjà son portail en Chine. Pourtant, Yahoo! vient d'inaugurer son premier site consacré uniquement à son automate de recherche nommé Yisou signifiant « recherche numéro 1 ».
La page d'accueil est aussi minimaliste que son rival Google. Elle comprend une case de recherche avec trois catalogues: le web, les images et les mp3, plus une liste de liens populaires et non son répertoire.
Les liens vers le portail, vers la messagerie, vers Yahoo Messenger et vers le site de 3721 qui présente une barre d'outils sont placés en retrait en haut de la page.
Yahoo! se place ainsi en concurrent direct de Google, tout comme Google l'a fait récemment avec Google Groups 2 et Gmail. Il semble que Yahoo! ait choisi le coup pour coup.
Jusqu'à maintenant, les sites d'AltaVista et d'AlltheWeb n'arborent aucun logo de Yahoo! Les deux sites sont au nom d'Overture, propriété de Yahoo! Ni l'un, ni l'autre site n'identifie la banque de données utilisée qui est celle de Yahoo! Search. Pour l'instant, l'automate de recherche de Yahoo! est imbriqué dans le portail. Yahoo! choisira-t-il d'ajouter son logo aux deux automates de recherche ou de créer un site particulier pour la recherche web à l'image de Yisou et Yahoo! Chine? La guerre des marques pour identifier clairement Yahoo! à la recherche web, serait-elle commencée?
posté par Marc Duval, #référence - 00:11
2004-06-20
Des jumelles pour papa Jeeves
Depuis quelques jours, le fond de la page d'accueil est devenu blanc au lieu de crème. Mais ce n'est pas là la nouveauté en ce jour où Jeeves fête son père.
Ask Jeeves a mis à l'essai pour son service de recherche - utilisant Teoma - sa prévisualisation de page web pour Internet Explorer en ajoutant des jumelles à la gauche de l'adresse URL. Contrairement à la prévisualisation disponible sur Vivisimo et Excite France, il n'y a pas d'ouverture de fenêtres. La page indexée apparaît au passage du pointeur, sans avoir à cliquer sur l'icône des jumelles. A noter que la prévisualisation est absente du site de Teoma.
Selon Reuters ( Ask Jeeves Zooms in on Web Search ), de nouveaux raccourcis ( Smart Search features ) ont été ajoutés pour les films, les pages blanches, la recherche de célébrités, les définitions et les registres de mariages! - registres absents du tableau des raccourcis au moment de la consultation. Reuters suggère qu'il y en aurait d'autres.
Star-Ledger ( Ask Jeeves is marrying searching, 'smart' features ) mentionne le suivi des colis, le niveau d'alertes de sécurité et le prix de l'essence aux États-Unis.
posté par Marc Duval, #référence - 13:52
2004-06-19
Find.com, métachercheur d'affaires
Un nouveau métachercheur est arrivé sur le web le 17 juin. Le métachercheur Find cible le marché d'affaires. Selon une étude de la firme de recherche Find/SVP instigatrice de ce site de recherche web, les grands sites de recherche généralistes comme Google et Yahoo! offrent une piètre performance pour le monde des affaires. Voilà la raison d'être de Find.com.
Find.com comprend quatre services de recherche: le web, le répertoire ODP, les études de marchés et les
actualités.
La recherche web est alimentée par AltaVista, AlltheWeb, Google, MSN Search, Teoma et Yahoo!
La recherche d'actualités puise dans Hoovers News, CNN News, AltaVista News, Biz Yahoo News, Forbes News et Google News.
Les études de marchés sont sous l'étiquette Research. Ce service de recherche regroupe les bases
de données commerciales comme celles de Frost, Find/SVP, Gallup et Gartner Net Content (Note: Gartner a été intégré à la recherche web plutôt qu'à Research).
Find s'appuie sur le logiciel de recherche pour entreprises MatchPoint de la société Triplehop qui organise et personnalise les recherches. Davantage qu'un organisateur de recherche, MatchPoint est aussi un automate de recherche spécialisé qui s'adapte au client. Find l'utilise pour son segment de recherche Business Web. MatchPoint reprend le résultat de recherche web et en extrait les pages d'affaires. Puis il organise le résultat et le gère.
La page de recherche est divisée en deux: La première partie est un volet d'organisation de l'information et la seconde le résultat de recherche.
Le volet d'organisation a quatre onglets: Topics ( sujets ), Formats(de la page), Sites (adresse des pages) et Sources. L'onglet Sources regroupe le résultat de recherche sous trois dossiers: le web d'Affaires - Business Web -, les études de marchés payantes - Premium Research - et les automates de recherche( Search engines ). Le web d'affaires trouve autant de l'information gratuite que payante.
La page de recherche comprend la case de recherche et les quatre onglets. Le formulaire de recherche donne les options de recherche dans le texte intégral ou par titres, la recherche par mots courants ou par concepts - ce qui nous ramène à l'ancien automate de recherche Excite -, le nombre de notices par page, la recherche par sources et la recherche par intervalles de dates à partir de 1992.
Les notices du résultat sont composées du titre, d'un extrait de la page, de l'adresse du site - et non de la page - et de la taille du fichier. Une icône active identifie le format du fichier.
Find.com a adopté la personnalisation de la recherche avec le suivi des requêtes. L'enregistrement permet la sauvegarde des requêtes, l'envoi par courriel et les alertes.
Find se pose comme un concurrent de Northern Light - qui devrait reprendre son service public cet été. On retrouve aussi dans cette catégorie Bussiness.com.
posté par Marc Duval, #référence - 09:06
2004-06-18
Findory, votre service de presse
Le 12 juin dernier, M. Gary Price de ResourceShield a fait mention du nouveau service d'information automatisé Findory. Il est apparu en janvier dernier. Findory est destiné au marché de langue anglaise. Il couvre entre autre les sites canadiens anglais.
Comme les autres services d'information automatisé, Findory divise les titres en 12 rubriques: la Une, les nouveaux articles, les États-Unis, les nouvelles internationales, les technos, les affaires, la science, les éditoriaux, les sports, les arts, le divertissement et la santé.
Findory n'a pas de formulaire de recherche, ni de fonction de tri. En contrepartie, il retient les articles lus dans son « History » dans lequel vous pouvez retrancher des titres et vous en servir comme dossier.
Autre nouveauté, il vous propose des articles similaires à ceux lus en ajoutant « * Personalized * » à la droite du titre. Si vous changez de sujet, Findory le notera et vous proposera des articles semblables au dernier titre lu.
Findory vous offre un service d'alertes (envoi des actualités par courriel) et aussi de vous suivre dans vos déplacements en vous enregistrant.
En plus des actualités traditionnelles, Findory propose de suivre les carnets web de langue anglaise avec le service The Findory Blogory.
La personnalisation est nettement une tendance et celle de Findory est intéressante dans la lignée de A9.com d' Amazon.
posté par Marc Duval, #référence - 13:50
Google personnalise votre module de recherche
Google vient de mettre à la disposition des webmestres un module de recherche ( Site-Flavored Google Search Box ) pour permettre aux visiteurs de chercher dans leur site web. Le module de recherche d'un automate sur un site n'est pas nouveau. Google offre un module de recherche traditionnel tout comme Hotbot et Yahoo . Des sites comme Cyberpresse l'utilise sur leur site. La nouveauté vient de la personnalisation de la page du résultat de recherche qui peut accueillir le logo de l'entreprise. La personnalistion du module de recherche est une adaptation de la personnalisation de la recherche web ( Personalized Web Search ). Le webmestre classe son site selon une thématique établie par Google. Lorsque la recherche est amorcée à partir du site, les pages ayant une thématique semblable au site sont identifiées par une bille de couleur. L'internaute a le choix de désactiver cette fonction et de faire une recherche régulière. La recherche se fait autant pour le site même que pour le web.
La personnalisation est disponible seulement en anglais pour l'instant.
Lire Les boîtes de recherche Google deviendront omniprésentes sur le Web, Branchez-vous, 20 juin
posté par Marc Duval, #référence - 07:51
2004-06-17
Des barres pour Mamma
Le métachercheur montréalais Mamma s'est mis à l'heure des barres avec une barre d'exploration ( Mamma.com Explorer Bar ) et une barre d'outils ( Mamma.com Toolbar ). La barre d'exploration de Mamma affiche les titres de résultats de recherche et permet de sauvegarder et de gérer les pages et les résultats de recherche. La barre d'outils de Mamma comprend les fonctions standards: accès à la recherche avancée, surlignage des termes de recherche, historique des recherches et anti-pop-up.
posté par Marc Duval, #référence - 15:57
2004-06-15
Des outils linguistiques sur Yahoo! France
Yahoo! France s'est doté d'outils linguistiques comprenant la recherche dans une langue et dans un pays, et dans un « Yahoo! spécifique ». La recherche par langue et par pays a une case de recherche tout comme celle dans un « Yahoo! spécifique ». La zone de traduction comprend les deux cases traditionnelles pour le texte et pour la page web.
posté par Marc Duval, #référence - 17:15
2004-06-14
Revue de la semaine du 7 au 11 juin
7 juin
Les barres d'outils des services de recherche web comme Google ont un bloqueur de fenêtres-pub. Les éditeurs de ce type de format publicitaire contre-attaquent en utilisant d'autres codes pour l'ouverture de ces fenêtres. (The Inquirer)
60% des utilisateurs de Google - qui détient 48% du marché - se disent prêts à changer si un autre automate de recherche plus performant leur était présenté. (Reuters)
8 juin
Google se prépare à se lancer résolument dans la recherche sur les téléphones cellulaires. Il a adapté son service Froogle à l'écran du sans-fil. Fort de ce succès, les autres services suivraient. Yahoo et Microsoft sont aussi dans la course pour le nouveau marché des téléphones mobiles. Cependant, la diversification de ses services pourrait l'affaiblir (AFP / Reuters)
Yahoo teste une nouvelle page d'accueil selon CNET News.
FindArticles ajoute un formulaire de recherche. Le formulaire permet la recherche par dates commençant en 1950, le choix de 7 tris, la recherche selon le nombre de pages des articles et la recherche par titres de publications parmi 500.
Google souligne des évènements en modifiant son logo. Le dessinateur M.Dennis Hwang invite les internautes à lui suggérer des évènements à commémorer dans le carnet web de Google.
Dans un article sur M. Matt Cutts, le parc informatique de Google inc. comprend entre 10 000 et 80 000 ordinateurs de bureau de bas de gamme répartie sur plusieurs centres de données à travers le monde. Il engrange plus de 6 000 terabytes de données. L'équipe de M. Matt Cutts s'occupe à améliorer le programme de recherche de l'automate. Il a annoncé que la célèbre Google Dance connue des webmestres serait chose du passé. (BBC News)
9 juin
Bitpipe, Inc. (www.bitpipe.com) et OSDN ont announcé le lancement de IT Research Library (whitepapers.osdn.com). Ce nouveau site fournit des rapports techniques et des études de cas en technologie de l'information. (Communiqué Bitpipe).
Sympatico et MSN s'unissent pour ouvrir un nouveau portail au Canada. (Bénéfice.net)
Microsoft dévoile quelques projets qui pourraient avoir des répercussions sur la recherche web dont celui des résumés d'articles. En plus de résumer un article, l'application en résumerait plusieurs pour constituer un rapport. (InternetNews / CNET News.com).
Ask Jeeves se lance dans la recherche sur disque local en acquérant Tukaroo. (Bénéfice.net)
M. Yusuf Mehdi, de MSN, annonce la sortie prochaine de la version bêta de son automate de recherche et son lancement de la version finale pour la fin de l'année. (WHIR)
M. Craig Silverstein de Google inc. affirme dans une entrevue qu'aucun automate de recherche ne pourra supplanter un bibliothécaire qui a l'avantage de comprendre le non-verbal. En ce qui concerne GMail, il espère que la polémique entourant ce service s'estompera. D'autre part, la recherche multimédia n'est pas une priorité pour Google. (CNET News)
10 juin
Google a perdu une bataille publicitaire en Australie aux mains d'Overture, filiale de Yahoo! Le modèle économique de Google est basé sur la publicité tout comme l'était celui de ses prédécesseurs avant l'éclatement de la «bulle Internet» en 2000 (News.com Australie).
Le combat contre le spam est devenu la priorité de Microsoft autant sur le courriel que sur la recherche
web. MSN travaille sur la qualité de l'index web en réduisant le « spam web ». MSN a étudié des milliers de pages de spameurs afin d'identifier leurs techniques et ainsi mieux les contrer. Les pages spamées pourraient être exclues ou déclassées (PC World)
comScore Networks a émis un communiqué sur la fréquentation des sites de recherche de la France, de la Grande-Bretagne, de l'Allemagne, des États-Unis et du Canada. Une comparaison est établi entre l'usage et la pénétration des sites de recherche. (Communiqué conScore Networks).
JupiterMedia a émis un communiqué pour annoncer le lancement des forums de SearchEngine Watch avec la participation de M. Danny Sullivan.
M. Andy Beal de Search Engine Lowdown a croqué la fonction de prévisualisation dans un résultat de recherche de Ask Jeeves. Cette fonction n'est pas réapparue depuis. En attente de confirmation.
11 juin
Business Week a publié un sondage portant sur le marché de la recherche Web. Bien que Google soit dominant pour la recherche, il pourrait avoir de la difficulté à s'établir comme marque dans d'autres segments de portails comme les services de messageries. De plus, Google n'a pas une clientèle captive comme l'ont ses concurrents. Et ses nouveaux services ne semblent pas enthousiasmer les internautes. Enfin, Google n'a pas de sources diversifiés de revenus. (Voir aussi 01Net)
Sympatico-MSN a lancé sa campagne publicitaire pour soutenir le nouveau portail comprenant un spectacle et de la publicité dans les journaux . La fusion sera complétée avec la fermeture sur service de messagerie de Sympatico à la fin de novembre pour laisser la place à Hotmail ( Infopresse.) ).
posté par Marc Duval, #référence - 17:31
2004-06-09
Adieu Google Dance?
Selon un article sur Matt Cutts, un employé de Google inc. qui aide les webmestres à optimiser leurs sites, Google tournerait la page à ce qui est appelé la Google Dance. La Google Dance consiste en une mise à jour de l'index et du programme informatique de recherche qui apparaît habituellement à chaque mois. Cette mise à jour est ensuite distribuée aux centres de données de Google. Cette progression observée est appelée Google Dance. Dorénavant, la mise à jour serait continue et sans soubresauts.
L'équipe de Matt Cutts travaille aussi sur les failles de Google telles que le Google Bombing et les effets indésirables des carnets web.
Plusieurs forums et sites ont fait leurs choux gras de la Google Dance. Espérons pour eux que ce n'est qu'une rumeur!
Source:
Inside the Google search machine, BBC News, 8 juin
posté par Marc Duval, #référence - 10:03
Arrivée du portail Sympatico-MSN
Les deux principaux portails canadiens Sympatico et MSN Canada sont maintenant fusionnés pour donner le portail canadien Sympatico-MSN. Leur union devrait faire de ce portail le premier au Canada. Sympatico apporte ses produits et services dont celui de fournisseur d'accès Internet, le contenu d'informations canadien et de divertissement. MSN offre ses produits et services dont son formulaire de recherche avec Inktomi (Yahoo) et son futur automate de recherche.
posté par Marc Duval, #référence - 07:33
2004-06-01
Troncature sur AOL
AOL Canada a remanié son site ce printemps. Maintenant, il propose AOL Canada en français. AOL Canada est composé du répertoire Open Directory et de l'automate de recherche Google. AOL a introduit un logiciel de recherche qui emploie la troncature pour son répertoire. La troncature consiste à utiliser un signe de remplacement pour une ou plusieurs lettres. La troncature est une fonction rare sur les automates de recherche. Seul AltaVista en était pourvu avant son acquisition par Yahoo! La lemmatisation (troncature automatique) est utilisée efficacement par Exalead, et par MSN et Google avec plus ou moins de bonheur.
La page d'aide d'AOL Canada en français apporte des éclaircissements. La troncature pour un caractère est représentée par le point d'interrogation « ? ». Le signe « ? » peut être placé à la fin du mot ou à l'intérieur du mot. La troncature pour plus d'un caractère est représentée par l'astérisque « * ». Le signe « * » peut être placé à la fin du mot ou à l'intérieur. Une page d'exemples de recherche chez AOL Canada en français est proposée.
posté par Marc Duval, #référence - 14:44
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un
ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.