Amazon : Livres sur la recherche web


DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec. Canada

Contrat Creative Commons
Mise à disposition sous un contrat Creative Commons.

Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine

Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

Ancien site ( dernier message  [2005-05-24] MSN sur les traces de Google Maps)
[Atom] /
Description, analyse et commentaire sur les sites de recherche.

Google
 
Web www.dsi-info.ca
Actualités des sites de recherche avec http://www.wikio.fr/high-tech/internet/moteurs_de_recherche.

2009-03-24

 

Amélioration sur Google Recherche Web


Amélioration sur Google Recherche Web -- Google Inc. annonce sur son carnet web deux améliorations portant sur les suggestions de recherche et l'extrait.

Selon le carnet web, les suggestions de recherche ont été améliorées en proposant des suggestions étendues. L'exemple donné est intéressant, mais lancé sur Google Web US, les suggestions n'ont pas été affichées. D'ailleurs, le nombre de documents affichés est de 24,600,000 sur l'exemple de Google et 16,300,000 sur deux ordinateurs vérifiés, (toujours sur google.com) au 24 mars. Cet écart est fascinant !

La seconde amélioration est l'apparition de plus de mots d'une requête de plus de trois mots dans l'extrait. En comparaison, l'extrait de Google a 4 lignes, ceux de Live Search et de Yahoo! Search ont 2 lignes, celui d'Ask a 4 lignes et Exalead 3 lignes. Cette « amélioration » est-elle significative ? J'en doute. S'il pouvait y avoir amélioration, ce serait la fenêtre de prévisualisation comme sur Clusty ou l'augmentation de l'extrait d'un clic de souris. Rappelons-nous que Excite avait la fonction Aperçu.

Ces deux améliorations ne me semblent pas significatives.

Libellés :


2008-09-15

 

Élections au Canada sur Google


Élections au Canada sur Google -- Le Bloc québécois, parti souverainiste au niveau fédéral, a mis des liens publicitaires sur Google web Canada. Cette publicité apparaît avec les requêtes Harper, Dion, Layton, élections fédérales, environnement, npd, parti conservateur, parti libéral et surement d'autres. De plus, le parti souverainiste et des partisans ont réussi à placer leurs sites parmi celles de la première page du résultat de recherche avec la requête bloc.
Le Bloc québécois n'a pas encore investi Yahoo! Québec qui est en pleine campagne promotionnelle à Montréal.
A part les élections, Google Inc. est en train de mettre en place la fonction Street View sur Google Maps Canada. Le guide de Street View a été aperçu, mais pas les lignes bleues identifiant les parcours.

Libellés : , , , ,


2008-03-12

 

Google, le meilleur... en apparence


Google, le meilleur... en apparence -- Une nouvelle étude allemande sur les automates de recherche vient de paraitre. Intitulée The Retrieval Effectiveness of Web Search Engines: Considering Results Descriptions, l'étude compare les quatre principaux acteurs de la recherche web : Ask, Google, MSN Search et Yahoo, et Seekport, un automate de recherche allemand. Si l'étude avait été menée par des chercheurs français, le cinquième compère aurait été Exalead.

L'étude s'appuie sur 40 participants ayant rédigé chacun une requête. Chaque participant juge la pertinence des vingts premières notices de sa requête. Les notices des quarante résultats de recherche sont ensuite soumises anonymement au jugement des participants afin d'évaluer la pertinence des extraits descriptifs.

Il en résulte que Google et Yahoo! sont ex equo. Suivent Ask, MSN Search et Seekport. Bien que Google et Yahoo! soient comparables, c'est Google qui domine le marché européen. L'étude montre que la prédominance de Google provient de la qualité de l'extrait des notices. Or, tous les automates de recherche utilisent le format KWIC (mots clés en contexte) mais ils ont des méthodes d'extraction différentes. Par conséquent, l'enjeu pour contrer Google est de concevoir la meilleure méthode d'extraction pour afficher les mots clés en contexte les plus pertinents. Conclusion : tout est question de perception.

Libellés : , , , ,


2008-03-08

 

Nouveau formulaire de recherche pour Google web


Nouveau formulaire de recherche pour Google web -- Il semble que Google Inc. soit en train de tester un nouveau formulaire de recherche pour Google web. En fait, il s'agit d'un réaménagement des champs de recherche sous forme de liste semblable au formulaire dépouillé d'AOL. La seule nouveauté est la réécriture de la requête à partir des cases de recherche. La réécriture avait déjà été utilisée par AOL.

Contrairement à AOL qui a un formulaire pleine page, celui de Google web a une partie cachée. Il faut cliquer sur un lien pour pouvoir faire une recherche par dates, par champs (titre, url...), par pays, par intervalles numériques, par licence Creative Commons et pour désactiver le filtre parental.

Libellés : ,


2008-03-05

 

Google vous téléporte


Google vous téléporte -- Google Inc. fait entrer les internautes dans l'ère de la téléportation en ajoutant une case de recherche dans certaines notices. Cette case est présente dans des notices de sites de journaux. En voici une liste sommaire : le Christian science monitor, le New York Times, le New York Post , le Los Angeles Times, le Washington Post, le Denver post, le Chicago Tribune, le San Francisco Chronicle, le San Diego Union Tribun, le San Francisco Chronicle, l'Arizona Republic et aussi The Toronto star et The Globe and Mail.

Elle est présente aussi dans les sites de l'administration étasunienne comme : la NASA, le US patent, le US Geology, le FBI, la Library of Congress et la FCC.

Les grandes entreprises ont aussi leur case de recherche comme Amazon, Walmart, Microsoft. On y trouve aussi le site de logiciels Tucows.

Plus besoin d'aller sur ces sites pour faire une recherche, Google US, Google Canada anglais et sans doute toutes les versions en anglais nous y amènent.

Note : Cette nouvelle fonction permet de rechercher dans la banque de données de Google au lieu du site trouvé. Elle remplace la requête [mot] site:[www.site.com]. Pour avoir de l'information à jour, préférez la recherche dans le site même plutôt que la case de recherche de la notice. En général, les sites majeurs ont leur propre logiciel de recherche. Elle est toutefois utile pour les sites de journaux qui archivent leurs articles gratuits dans leur section payante.

Libellés : , ,


2007-11-09

 

Google et la recherche multilingue


Google et la recherche multilingue - En 2005, Yahoo! France avait introduit la recherche multilingue, maintenant abandonnée. Google Inc. semble vouloir reprendre cette fonction. Le formulaire de traduction a été modifié. Google Inc. affiche ce conseil :
Utilisez la recherche avancée pour restreindre votre recherche par langue et par pays sans traduire les termes de recherche.
Les quelques requêtes lancées ne m'ont pas convaincu de l'efficacité de cette recherche multilingue. Il est décevant que Yahoo! France ait jeté l'éponge.

Ajout (10-11-2007) : La recherche multilingue est encore disponible dans Yahoo! Search Images (France).

Libellés : , , , ,


2007-11-08

 

Google Web recherche par régions


Google Web recherche par régions -- Depuis hier, le formulaire de recherche web de Google s'est enrichi de la recherche par « régions ». Ce nouveau champ de recherche n'est pas encore établi avec des apparitions sporadiques. La liste comprend plus de 230 régions dont le Saint-Siège (Vatican), « Les iles mineures éloignées des États-Unis », « Wallis et Futuna », les « îles Turkes et Caïques », les «terres australes françaises ».

La liste des régions en français est la traduction de la liste en anglais sans tri. Cela signifie que les États-Unis sont classés à United States. Présumons que la liste définitive aura un classement alphabétique français.

Libellés : , , ,


2007-10-31

 

Google expérimente sur google.com


Google expérimente sur google.com -- Le laboratoire de Google Inc. abrite Google Experimental. Il expérimente le tableau chronologique, l'affichage des documents d'information et différents extraits de notices, entres autres.
Nul besoin d'aller visiter le labo. Utilisez le préfixe de recherche view: suivi des mots-clés timeline, info et map sur google.com comme ceci view:timeline, view:info et view:map. La requête lancée affiche la page de Google Experimental. De là, vous pouvez choisir le format d'affichage des notices parmi les formats date, mesure, localisation et images. Puisque vous êtes entré dans le labo, profitez-en pour essayer les raccourcis clavier et les propositions d'affichage des suggestions de recherche et des services, plus pratique que ce qui est proposé sur google.com. Préférez Internet Explorer pour cela.

Libellés : ,


2007-10-12

 

Google, Luciano Pavarotti et la « recherche universelle »


Google, Luciano Pavarotti et la « recherche universelle » -- Google Inc. rend hommage à Luciano Pavarotti avec une recherche imbriquée dans le logo. Cet hommage est un exemple de la fallacieuse recherche universelle. Auparavant, Google Inc. mettait ses autres sources d'informations (actualités, photos, musique, etc.) au début de la liste des notices. Lorsqu'il testait ses suggestions de recherche, c'était aussi au début de la liste. Elles ont été déplacées en bas de page. Google Inc. avait commencé à ajouter à la fin de la première page des messages provenant de la recherche de carnets web et des Groupes de discussion. La recherche universelle a poursuivi cette démarche en intégrant YouTube à la liste du résultat de recherche. Plusieurs études oculométriques ont démontré que les internautes ne consultent en général que les cinq premières notices, comprenant les trois liens publicitaires pour les internautes non avertis. La recherche universelle n'est que la généralisation de l'encadrement des notices de la première page d'un résultat de recherche pour forcer les internautes à parcourir la page entière, par conséquent de voir toute la liste des liens commandités latérale. Est-ce une bonne stratégie quand on voit la présentation synoptique de ses concurrents, notamment d'Ask, plus conforme au comportement des internautes ?

Libellés : ,


2007-07-17

 

Yahoo, un trésor méconnu des pirates


Yahoo, un trésor méconnu des pirates -- Le 10 juillet, le journal Les Échos publiait l'article Google, l'arme des pirates pour télécharger musique et vidéo. L'auteur divulguait une requête (formule spéciale selon l'auteur) servant à dénicher des fichiers audios et vidéos. Cette requête est : intitle:"index of" (mp3|mp4|avi) [titre] -html -html -php -asp -cf -jsp où [titre] est "no.one.knows". Le résultat de cette requête donnait 54 pages. Jymmy Ruska, l'auteur de la vidéo sur YouTube, aurait pu mettre le préfixe de recherche filetype: ou ext: pour éliminer les pages html, et al.

Il n'y a pas que Google qui permet ces trouvailles. Yahoo! a une recherche avancée plus puissante, héritée de feu Inktomi.
La formule magique de Jymmy Ruska traduite pour Yahoo! est plus sophistiquée.
La voici : TITLEWORDS(index of) mp3 OR mp4 OR avi "no-one-knows" -originurlextension:html -originurlextension:htm -originurlextension:php -originurlextension:asp -originurlextension:cf -originurlextension:jsp.
Le résultat de cette requête donnait 155 pages.

Notez que Yahoo! a aussi le préfixe intitle:. Cependant le préfixe TITLEWORDS() est plus efficace. L'équivalent du préfixe filetype de Yahoo! est originurlextension:. Ce préfixe est long. C'est qu'il fait parti d'une série préfixes exploitant les extensions de fichiers, notamment dans les pages web.

Mise en garde : des virus, des chevaux de Troie et des espiogiciels peuvent s'infiltrer dans votre ordinateur si un site demande le téléchargement d'un soi-disant logiciel permettant de mieux visualiser le fichier. La recherche sur Google ou sur Yahoo! est plus dangereuse que sur YouTube et cie.

Parlant de Yahoo!, la société a ajouté les suggestions de recherche à Yahoo! Recherche sur son site étasunien. Cette nouvelle fonction traite différemment les requêtes avec des mots accentués. Les suggestions fonctionnent comme un index inversé. Yahoo! proposera cinq expressions dans lesquelles se trouve le premier mot de la requête quelle que soit la place du mot dans l'expression. Par exemple, à la requête Québec, Yahoo! Recherche proposera emploi québec, toile du québec, loto québec, festival d'été de québec, hydro québec.

Libellés : , , , ,


2007-06-28

 

Google modifie sa recherche par dates


Google modifie sa recherche par dates -- La société Google a modifié sa recherche par dates. Auparavant, Google affichait la notice des documents qui étaient mis à jour, ce qui comprenait aussi les documents nouvellement indexés. Dorénavant, cette fonction de recherche affichera seulement la notice des nouveaux documents. Cette modification est reflétée dans le libellé de la recherche par dates dans le formulaire. Le libellé Lister les pages Web mises à jour pendant la période spécifiée est devenu Rechercher les pages Web découvertes durant. Remarquez qu'il faut entendre documents par pages Web puisque l'on peut faire des recherches par formats de fichiers.

Libellés : , ,


2007-06-10

 

Google Earth dans Google Web


Google Earth dans Google Web -- Si vous êtes accro de Google Earth, vous aurez le bonheur de trouver des hyperliens vers Google Earth dans Google Web. Vous aurez le choix de les trouver par le formulaire de recherche dans la liste déroulante des formats. Deux libellés permettent de les identifier : Contenu KML Google Earth (.kml) et Contenu KMZ Google Earth (.kmz).

Si vous voulez faire une recherche des deux formats, utilisez cette formulation dans votre requête : filetype:kml OR filetype:kmz ou ext:kml | ext:kmz. Les hyperliens sont identifiés par [kml] qui inclut l'extension .kmz. Vous y trouverez aussi des liens avec l'extension .kmz mais sans l'étiquette [kml]. Ce sont des pages qui ont une carte de Google Maps ou un lien vers GM.

Ces pages peuvent être non pertinentes. La recherche se fait sur le code source de la page et non sur le lien vers Google Earth, ce qui est décevant. Une recherche avec le terme Quebec apporte toutes les pages ayant ce terme dans une balise (l'adresse de l'éditeur de la page par exemple) ou dans le contenu. Ce qui n'est pas gage de pertinence. L'intégration des liens de Google Earth ne me semble pas aboutie... comme d'habitude. Heureusement que la Société fait des acquisitions !

Lorsque vous sélectionnerez un lien identifé [kml], assurez-vous d'avoir le logiciel Google Earth parce que c'est cette application que le lien ouvrira.

Mise à jour - 12 juin : Vous pouvez aussi faire une recherche pour trouver des fichiers d'Autodesk DWF (.dwf) afin de les publier sur Google Earth. Une Google Earth Extension est disponible pour AutoCAD 2007 et AutoCad 2008.

Libellés : , , ,


2007-02-14

 

De l'affichage sur Google web


De l'affichage sur Google web -- Il y a quelque temps la société Google Inc. avait introduit dans l'affichage de ses résultats de recherche web une liste de requêtes reliées identifiée par Searches related to : . Après avoir disparues, elles sont revenues non pas en tête du résultat de recherche, mais à la fin. Les requêtes reliées sont disponibles seulement sur google.com, semble-t-il.








L'année dernière, Google Inc. avait introduit une page d'avertissement intercalaire entre la notice et sa page web. Récemment, Google Inc. a inséré cette note d'avertissement dans la notice même Ce site risque d'endommager votre ordinateur.










Enfin, la société a ajouté le lien de développement + aux notices de certaines entreprises cotées en bourse afin de montrer un graphique boursier.
















D'autres entreprises ont gardé l'affichage directe dans la notice avec des liens vers d'autres sources boursières et les actulalités. Ce dernier affichage est aussi amené par le préfixe de recherche stock:.

Libellés : , ,


2007-01-06

 

Kids Help sur Google


Kids Help sur Google -- «Le moteur de recherche Google a permis à l'enfant d'envoyer un message à un site d'aide en ligne pour les enfants en Australie, qui a averti la police locale, a expliqué à l'AFP, Julie Gagnon de la Gendarmerie royale du Canada (GRC).»
Appel à l'aide sur le Web: un enfant retrouvé, AFP- Technaute, 5 janvier

Sans enlever à Google, MSN (Windows Live Search) et Yahoo affichent le même résultat. Les notices de Google ont un classement variable, contrairement à ses deux concurrents. Si l'enfant a utilisé le bouton j'ai de la chance, il a pu effectivement arrivé sur le site australien directement. Si l'enfant avait utilisé le résultat de recherche, il aurait pu trouver le site canadien Kids Help Phone. Une autre journée, il aurait pu arriver sur le site canadien avec le bouton I'm feeling lucky. Heureusement qu'il est anglophone. S'il avait été francophone, ni Google, ni MSN et ni Yahoo n'auraient pu l'aider aussi efficacement.

Libellés : , , , ,


2006-12-31

 

Wikiasari dites-vous ?


Wikiasari dites-vous ? -- M. Jimmy Wales, fondateur de la cyberencyclopédie Wikipédia, a l'ambition de concurrencer Google. Il projette de lancer en 2007 (le premier trimestre est mentionné) un site de recherche sur le modèle collaboratif de son encyclopédie Wikipédia. Plusieurs commentateurs avancent le nom Wikiasari.
En 2004 avait été lancé le projet de logiciel de recherche Wikiasari. Un an plus tard, il a été abandonné. Le projet de M. Wales est tout autre et ne reprendra pas le nom de Wikiasari.
Le nom de Wikisearch a été lancé aussi. Wikisearch est le nom du logiciel de recherche de la communauté Wikipedia en collaboration avec searchme.com. Le nom de Wikisearch ne sera pas celui du nouveau site de recherche.
Parmi les investisseurs dans le projet de l'automate de recherche, le cyberlibraire Amazon est cité. Amazon est un donateur de la fondation Wikimedia tout comme peuvent l'être Yahoo! et Google. Le don d'Amazon n'est pas directement relié au projet de l'automate de recherche.

Yahoo! et Google, entre autres services de recherche, intègrent partiellement l'encyclopédie Wikipédia dans leurs résultats de recherche. Wikipédia serait sans doute mieux servie si elle avait son propre automate de recherche autant pour mettre en valeur ses projets wiki (actualités, citations, dictionnaires, encyclopédies...) que pour indexer le web.

Le nouvel automate de recherche s'appuierait sur le logiciel Nutch, un projet d'Apache Lucene. Le groupe de travail francophone Fructh (Francopho Nutch) publie un carnet web à propos de Nutch. Pour en voir une application, allez sur le récent site de recherche Misterbot (Lire Misterbot adopte Nutch Moteur de recherche Open source ?)

D'autres ont essayé sans réussir. Ce n'est pas que Google soit plus pertinent que les autres. Ce qui leur manque c'est le capital de sympathie qu'à Google. M. Wales pense réussir son coup grâce à la notoriété de Wikipédia. Espérons que les pages plébiscitées par les contributeurs, quel que soit le système choisi, ne souffriront pas d'éditorialisme aigu et d'approximation approximative comme l'article wikipédique sur le Québec ! Le concours pour trouver le nom du nouveau site de recherche est ouvert. Souhaitons prospérité au nouveau venu.

Lire :
Misterbot adopte la technologie de recherche open source Nutch, VNunet France, 10 mars 2003
Qu'est ce que Nutch ?, Misterbot, sd. (comprend l'analyse comparative Nutch / Google en anglais - format pdf)

Libellés : , , , , , ,


2006-12-28

 

Google : des cartes dans les notices


Google : des cartes dans les notices -- Des cartes routières sont apparues dans les notices de commerces sis aux États-Unis dans une recherche sur Google Web. Il est possible que les cartes aient été implantées en cours d'année, mais c'est la première fois qu'elles ont attiré mon attention lors d'une recherche d'un restaurant à New York.
Voici un exemple de notices dans le résultat de recherche de la requête restaurant new york.






Remarquez le signe + invitant à cliquer dessus.
Voici la carte routière déployée :



Si la carte était dans la page web, l'ajout à la notice aurait été une bonne idée. Mais la carte ne fait pas partie de la page web et l'adresse est sous forme d'une image sans métadescription.

Parce que ce ne sont pas toutes les notices commerciales qui ont cette caractéristique, cette carte serait-elle de la publicité déguisée ? N'est-ce pas un atout pour ce commerce d'avoir un carte à la portée de l'internaute ?

Libellés : , ,



Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.