Amazon : Livres sur la recherche web


DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec. Canada

Contrat Creative Commons
Mise à disposition sous un contrat Creative Commons.

Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine

Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

Ancien site ( dernier message  [2005-05-24] MSN sur les traces de Google Maps)
[Atom] /
Description, analyse et commentaire sur les sites de recherche.

Google
 
Web www.dsi-info.ca
Actualités des sites de recherche avec http://www.wikio.fr/high-tech/internet/moteurs_de_recherche.

2007-02-25

 

Recherche web : Acheteurs et chercheurs d'info lisent différemment


Recherche web : Acheteurs et chercheurs d'info lisent différemment -- La firme De Vos & Jansen Market Research and Search Engine Mediabureau Checkit a publié une étude oculométrique portant sur la lecture d'un résultat de recherche. L'étude est intitulée Buyers and information searchers view search results differently. Cinq sites de recherche ont fait l'objet de l'étude : Google, MSN Search Live, Ilse, Lycos et Kobala. Les participants devaient rechercher cinq produits et services populaires : un prêt pour une rénovation, une voiture d'occasion, une assurance auto, un billet d'avion vers New York et un lecteur MP3 de Philips. La moitié des répondants devait trouver de l'information sur les produits et services alors que l'autre moitié devait avoir l'intention de les acheter.

La firme néerlandaise conclut que :
  1. Les internautes prennent en moyenne 1,1 seconde pour lire une notice.
  2. 98% regardent les notices.
  3. 96% regardent les trois premiers liens commandités.
  4. 31% regardent les liens commandités latéraux.
  5. Les acheteurs lisent plus de notices (10) et prennent plus de temps à les lire toutes (11,4 secondes) en se concentrant sur les marques de commerce.
  6. Les chercheurs d'info lisent moins de 8 notices et prennent moins de temps à les lire toutes (9,4 secondes). Ils s'intéressent plus au contenu qu'aux marques de commerce.
Des recommandations habituelles suivent l'étude.

Source : Buyers and information searchers view search results differently, Checkit, Communiqué, 22 février

Libellés : ,


2007-02-23

 

Webzzle communique


Webzzle communique -- Le site de recherche web collaboratif Webzzle vient de publier le communiqué WEBZZLE, la révolution du moteur de recherche collaboratif, Le pouvoir de la recherche collective en ligne.

Extrait :
Webzzle est un service gratuit qui permet d'organiser (stocker, qualifier et partager) tout ce que l?on aime dans le monde numérique (pages Web, documents pdf, photos numériques...). Non seulement Webzzle va au delà des systèmes comme Del.icio.us en permettant de gérer le sens aux travers des concepts et des Objets mais en plus, Webzzle apporte un moteur de recherche et un explorateur très puissant grâce à deux nouvelles technologies : une pour la représentation de l'information et une pour l'Energie Relative (Technologie).

Pour les internautes intéressés à apporter leur contribution, Webzzle souhaite atteindre au moins 10 000 utilisateurs quotidiens pour devenir efficace.

Enregistrement requis.

Libellés : ,


2007-02-21

 

Appelez-moi Jyve


Appelez-moi Jyve -- Jyve, à ne pas confondre avec l'ancien majordome Jeeves de Ask.com, est un nouveau service de référence en ligne dans la mouvance du web collaboratif et ChaCha de ce monde. Il est sorti de la cuisse de Skype, le service téléphonique par internet, pour s'y greffer en tant que plugiciel. Il est arrivé au moment où Google Answers tirait sa révérence.

Son nom viendrait de l'expression skip jive avec les y pour rappeler Skype. Sa première signification est une danse populaire en Grande-Bretagne dans les années 50 et 60, mais il y a aussi baratin et foutaise. Bonne trouvaille pour un service de référence en ligne d'avant-garde !

Comme la plupart de ces services de référence, il y a un libre service et un service avec enregistrement. L'internaute pose sa question et choisit un thème parmi 18. La question est répondue par un expert disponible. Une liste d'experts est affichée permettant à l'internaute d'en choisir un.

Avec tous ces enregistrements pour accéder à la personnalisation d'un service de recherche, entre autres, que de traces nous laissons sur le web !

Libellés : , ,


2007-02-14

 

De l'affichage sur Google web


De l'affichage sur Google web -- Il y a quelque temps la société Google Inc. avait introduit dans l'affichage de ses résultats de recherche web une liste de requêtes reliées identifiée par Searches related to : . Après avoir disparues, elles sont revenues non pas en tête du résultat de recherche, mais à la fin. Les requêtes reliées sont disponibles seulement sur google.com, semble-t-il.








L'année dernière, Google Inc. avait introduit une page d'avertissement intercalaire entre la notice et sa page web. Récemment, Google Inc. a inséré cette note d'avertissement dans la notice même Ce site risque d'endommager votre ordinateur.










Enfin, la société a ajouté le lien de développement + aux notices de certaines entreprises cotées en bourse afin de montrer un graphique boursier.
















D'autres entreprises ont gardé l'affichage directe dans la notice avec des liens vers d'autres sources boursières et les actulalités. Ce dernier affichage est aussi amené par le préfixe de recherche stock:.

Libellés : , ,


2007-02-09

 

Le tri par pertinence est-il fiable?


Le tri par pertinence est-il fiable? -- Il se publie sur le web des articles de sites suffisamment réputés pour que l'on ne les remette pas en doute. C'est le cas de Technaute de Cyberpresse, site d'informations du groupe Gesca possédant entre autres les grands journaux La Presse de Montréal et Le Soleil de Québec. Voici la chronique intitulée Le tri par pertinence est-il fiable ? apparemment sans reproche pour tout lecteur dans la section Conseil de pros.

Examinons quelques affirmations. Selon l'auteur, « il
existe plusieurs milliers de moteurs de recherche, dont une centaine de principaux. ». Le lien mène vers l'article en anglais «Search Engine » de Wikipedia. Un lien vers l'article en français aurait été tout aussi bien. En fait, il y a en quatre principaux : Ask, Google, Microsoft Live Search et Yahoo! Search, et deux secondaires : Exalead et Gigablast. Les autres sont des acteurs mineurs.

Selon l'auteur, les «moteurs de recherche» «s'appuient sur des algorithmes sémantiques pour indexer chacun des documents présents dans la base de données.» Les algorithmes ne sont pas sémantiques, ils sont statistiques et ils se basent sur les champs d'une page web (titre, URL, domaine, etc.), la position des mots entre eux et dans la page, leurs formats (sous-titre, casse, l'apparence de la police - gras, italique, etc. -, hyperliens... ), l'analyse des hyperliens entrants et sortants... , comme l'auteur l'écrit d'ailleurs! Les algorithmes sémantiques sont encore dans les laboratoires. Powerset est le logiciel de recherche web en préparation utilisant la recherche sémantique. Parmi les sites de recherche majeurs, Google donne un avant-gout avec son opérateur de synonyme (le tilde ~ ). Mais ce n'est pas encore de la recherche sémantique. Du côté européen, le projet allemand Theseus a pour but d'en développer un.

L'auteur semble ne pas maitriser ni la recherche sémantique, ni la recherche statistique, ni les concepts de moteur de recherche et de métachercheur tout comme Wikipedia en français dont Gigablast est identifié à un métachercheur alors qu'il est un automate de recherche (mais pas dans l'article en anglais de Wikipedia).

D'après l'auteur, certains «moteurs de recherche» privilégient les sites d'entreprises et d'autres non avec un exemple à l'appui sur Altavista.fr (qui n'est pas un «moteur de recherche» mais un «site de recherche» utilisant Yahoo! Search.) et Google.fr. Dans son exemple, il y a une erreur de méthodologie de recherche dans la comparaison. Sur AltaVista.fr, la recherche est limitée à la France ; sur Google.fr aux pages francophones. En limitant la recherche à la France sur Google, le résultat est similaire.

Il est heureux qu'il n'y ait pas de référence à DSI-info. Je serais gêné d'être cité.

Cela étant écrit, nul n'est sans tache.

En complément de lecture :

La ?cherche? se cherche? - L?approche technologique, Transnets (carnet Web de Francis Pisani), 23 janvier 2007

Libellés : , ,


 

Xerox appuie Powerset


Xerox appuie Powerset -- Selon PC World, Xerox Corporation a décidé d'investir dans la jeune société Powerset, le concurrent potentiel de Google, qui mise sur la recherche sémantique dite aussi recherche en langage naturel. L'investissement de Xerox se traduit par une mise à la disposition de Powerset des brevets provenant de son centre de recherche et développement Palo Alto Research Center (PARC) en contrepartie du partage des revenus. Cet apport représente près de 30 ans de R&D.

La jeune société accueillera un informaticien-linguiste sénior qui a participé au développement du logiciel de recherche en langage naturel de PARC. Des chercheurs de Powerset seront également dépêchés à PARC.

Le défi des chercheurs est le traitement des données afin de répondre rapidement à la requête. Pour réussir, Powerset devra afficher la réponse pertinente aussi prestement que les logiciels de recherche établis. La société Powerset espère lancer son automate de recherche à la fin de 2007. Elle a l'ambition de décliner son site de recherche en plusieurs langues durant 2008, dont le français.

Le site de recherche Hakia et Lexxe font une démonstration éloquente de l'avenir des sites de recherche en langage naturel.

Source :
Xerox Works Deal to Rival Google, PC World, 9 février

Powerset Aims to Leapfrog Google, InernetNews, 9 février

Libellés : , ,


2007-02-07

 

Yahoo! lance Panama. Chapeau!


Yahoo! lance Panama. Chapeau! -- La société Yahoo! a lancé officiellement sa nouvelle plateforme publicitaire pour concurrencer Google Inc. Le fait intéressant est que Yahoo! propose de monétiser les sites, du plus petit site personnel au plus grand, en quelques clics comme le fait Google AdSense. Un ciblage plus précis par thématiques permet d'afficher des annonces plus pertinentes que celles de Google AdSense, nous promet-on.

La présente force de Google est le programme Google AdSense pour les recherches. C'est pourquoi la case de recherche de Google est la plus répondue, lui permettant d'avoir une audience et des revenus avec une croissance exponentielle. Yahoo! Search Builder faisant partie de la nouvelle plateforme devrait être le pendant de Google AdSense pour les recherches. Si cette plateforme réussit à s'implanter, Yahoo! Search verra une augmentation continue de son audience. Les statistiques de comScore, entre autres, seront à surveiller.


Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.