Amazon : Livres sur la recherche web


DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec. Canada

Contrat Creative Commons
Mise à disposition sous un contrat Creative Commons.

Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine

Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

Ancien site ( dernier message  [2005-05-24] MSN sur les traces de Google Maps)
[Atom] /
Description, analyse et commentaire sur les sites de recherche.

Google
 
Web www.dsi-info.ca
Actualités des sites de recherche avec http://www.wikio.fr/high-tech/internet/moteurs_de_recherche.

2007-01-21

 

Yahoo! CopiePresse et les pages en cache


Yahoo! CopiePresse et les pages en cache -- CopiePresse, société représentant des éditeurs belges, a envoyé une mise en demeure à la société Yahoo! France afin de retirer les pages mises en cache dans l'index de recherche web.

Je fais de la recherche web depuis plusieurs années et j'ai consulté des pages en cache comme tout bon chercheur. Il arrive souvent que des pages soient rendues inaccessibles par divers procédés notamment par redirection vers une autre page. De plus, les sites de recherche comme Yahoo! propose aux webmestres la commande pour interdire l'accès aux pages web à ses robots indexeurs.
Pour le bénéfice de CopiePresse, voici l'article d'aide sur le robot d'indexation de Yahoo :

Notre robot reconnaît le meta-tag noarchive. Vous pouvez donc placer au début de vos docuements (sic):

Ce tag dit aux robots qui parcourent vos pages de ne pas les archiver. Notre robot continuera donc à suivre les liens de vos pages (et éventuellement de les indexer) mais sans les mettre en cache.

Il est à noter que le changement ne s'effectuera que lorsque notre robot passera sur vos pages (ce n'est qu'alors qu'il détectera votre nouveau meta-tag noarchive). Habituellement, cela peut prendre jusqu'à un mois.

Pour résumer, le tag noarchive empêche notre robot de mettre vos pages en cache. Il n'a pas du tout le même effet que le tag noindex qui dit au robot de ne pas ajouter vos pages à son index.

Plusieurs webmestres se prévalent de cette commande. C'est pourquoi plusieurs notices n'ont pas le lien vers la page en cache comme certaines d'entre elles du site du journal Le Devoir.
Je présume que la mise en demeure des éditeurs belges est le dernier recours après qu'ils aient tout fait pour que leurs pages ne soient pas mises en cache.
Si nul n'est censé ignoré la loi, ne peut-on dire que nul n'est censé ignoré les procédés d'indexation ?
En ce qui concerne Yahoo! Actualités, Yahoo! signe des ententes de partenariat pour la diffusion des articles. De plus, les articles de Yahoo! Actualités n'ont pas de cache mais une fonction d'enregistrement pour les membres de Yahoo!

A lire :
Yahoo! et CopiePresse : bataille sur les droits d'auteurs, Génération Nouvelles Technologies, 20 janvier

Libellés : , , ,



Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.