Service de recherche documentaire
Service de recherche documentaire DSI 
par Marc Duval, bibliothécaire

Le langage
des automates de recherche:

Le champ de recherche Méta-description
Dernière mise à jour : 2003-12-01

Introduction
Opérateurs  booléens
Opérateurs de proximité
Troncature
Champs de recherche
Requêtes complexes
Conclusion
Formulaire de recherche
Tableaux
Les opérateurs logiques
Les champs de recherche
Affichage et fonctions

.
Accueil DSI
Introduction
La nature du web
Le mot clé
Les automates de recherche
-Les fiches techniques
-Le langage de recherche
Le classement des automates de recherche
Le web universitaire
Le palmarès des villes: un exemple de recherche
Le carnet de recherche
Les actualités




Champs et sites de recherche

    Les sites de recherche ont développé des préfixes de recherche comme nous l'avons vu avec AltaVista.  Le but de ce chapitre est d'identifier chacun de ces champs, leur utilisation et le préfixe correspondant utilisé par chacun des sites de recherche.
    Les champs de recherche sont aussi utilisés pour l'affichage.  C'est ce qui clora ce chapitre. En voici les parties:

1. - Les champs
     1.01    Champ Texte
        1.011    La casse
        1.012    Les signes diacritiques
        1.013    Le correcteur orthographique
        1.014    La taille du fichier
                    Tableau
    1.02    Champ Langue
    1.03    Champ Domaine géographique
    1.04    Champ Méta-titre
    1.05    Champ Méta-description
    1.06    Champ Meta Keywords (méta-mots)
    1.07    Champ URL
    1.08    Champ Serveur
    1.09    Champ Domaine de tête
    1.10    Champ Format de fichiers
    1.11    Champ Hyperlien
    1.12    Champ Dates
[en préparation]

2. - Affichage
    2.01    Les formats d'affichage
    2.02    Le tri


Le champ « méta-description »

Le champ méta-description a disparu de la recherche.  Un vestige de ce champ traine encore dans le formulaire de Toute le web francophone du portail Voila.  Voila a gardé ce champ de recherche dans la liste déroulante sous la forme : placés dans les métas-descriptions.  Ce champ du formulaire de recherche ne semble plus être opérationnel.  Malgré que ce champ ne soit plus actif, la plupart des automates l'indexent et l'affichent en tout ou en partie.
    Un test sur la  méta-description a été mené sur AlltheWeb, AltaVista, Gigablast, Google, HotBot-Inktomi, HotBot-MSN, Teoma, Tout le web francophone (TWF) de Voila et WiseNut.  Le test a porté sur deux mots : googel et enfiroiper.  Pour distinguer le mot « enfiroiper » mis dans la balise « keyword », il a été placé au début de la balise Description entre crochets sous cette forme: [ test : enfiroiper ].
    Voici le tableau indiquant l'indexation de la page par les automates et la prise en compte de la recherche dans la méta-description.  Dans les exemples ci-dessous, « googel» est seulement dans la balise Description d'une page et dans le corps d'une autre page uniquement.  Dans l'exemple « enfiroiper », le mot est uniquement dans la méta-description de trois pages et dans le corps et la balise d'une page.  Le test est validé lorsque l'automate affiche une page ayant le mot uniquement dans la balise.  Les automates de recherche fournissent des résultats inégaux.  L'entrée de nouvelles pages, les périodes de pointe de recherche et les modifications des algorithmes sont des facteurs influançant leur comportement.  Ces deux tests sont des indicateurs.


googel
enfiroiper

Page
Description
Page
Description
AllheWeb
Oui
Non
Oui
Non*
AltaVista
Oui
Oui
Oui
Oui
Gigablast
Oui
Oui
Non
Non
Google
Oui
Non
Oui
Non*
Inktomi (HotBot/MSN)
Oui
Oui
Oui
Oui
Teoma
Non
Non
Non
Non
TWF (Voila)
Oui
Non
Oui
Non
WiseNut
Non
Non
Non
Non
* Le mot apparaît dans la balise description et dans le corps du texte.

    Lorsque le mot de la requête est uniquement dans la balise «Description»,

  • AlltheWeb affiche la notice seulement si elle est unique.  Dès qu'il y a une page d'un autre site, elle disparaît.  AlltheWeb est le seul automate qui utilise nommément le champ «Description».
  • AltaVista affiche la notice et une ligne provenant de la balise «Description» avec d'autres pages dans le format du mot en contexte sans identifier la provenance.    L'affichage a une ligne de la balise Description et une ligne du texte contenant les mots de la requête ou la première ligne du texte.
  • Gigablast affiche la notice et une ligne de la méta-description sans identifier la provenance dans le format du mot en contexte.
  • Google affiche la notice seulement si elle est unique.  Dès qu'il y a une page d'un autre site, la notice disparaît.  L'extrait de la balise «Description» est affiché sans identifier la provenance dans le format du mot en contexte lorsque la requête donne une ou des réponses provenant du même site.
  • Inktomi - HotBot et MSN - affiche la notice et le contenu de la balise «Description» avec d'autres pages sans identifier la provenance.  S'il y a un des mots de la requête dans le texte, le format en contexte est affiché.

    Voici comment chacun d'eux affiche la partie de la notice:

AltaVista
Requête = googel host:www.dsi-info.ca
Affichage  = Description de la recherche de documents en format pdf par l'automate de recherche Googel. ... SERVICE DE RECHERCHE DOCUMENTAIRE par Marc Duval, bibliothécaire Google et la recherche de documents «pdf ...

Requête = enfiroiper
Affichage = test : enfiroiper ]Description, analyses et observations sur les moteurs de recherche et les répertoires ... DSI. Le carnet des sites de recherche par Marc Duval Service de recherche documentaire DSI ...

AlltheWeb
Requête = googel [langue :  français]
Affichage = Aucun

Requête = googel pdf dsi
Affichage =   ... Accueil DSI ... info.ca/moteurs-de-recherche.pdf [champ Serveur] dsi-info [requête => host:dsi ... domain:ca] [champ URL] dsi-info.ca/moteurs-de-recherche.pdf [requête => url:"moteurs ...
Description: Guide du langage d'interrogation des moteurs de recherche. Description des champs de recherche.

Requête =  google pdf dsi
Affichage = ... bibliothécaire Google et la recherche de documents «pdf» Fiche ... sowc2002-fr-full.pdf - Pages similaires Le défaut de Google est de ne pas donner ... 2001. http://www.dsi-info.ca/moteurs-de-recherche/Google/reche rche-d-images ...
Description: Description de la recherche de documents en format pdf par l'automate de recherche Googel.
Note: l'affichage en gras des mots dans la balise Description est aléatoire.  Cette balise n'a pas valeur de classement.

Requête  = enfiroiper
Affichage =  ... faire dans un délai de 24 h avec la requête « enfiroiper ». Ni Google, ni AlltheWeb, ni Inktomi, ni Teoma ... de recherche en utilisant une orthographe rare: enfiroiper. Enfiroiper ou enfirouaper signifie se faire rouler. Les deux ...
Description: [ test : enfiroiper ]Description, analyses et observations sur les moteurs de recherche et les répertoires
Gigablast

Requête = googel pdf
Affichage = ...de documents en format pdf par l'automate de recherche Googel.....SERVICE DE ..RECHERCHE ..DOCUMENTAIRE .. par Marc.....PRENDRE L 'INITIATIVE ... www.unicef.org/french/sowc02/pdf/sowc2002-fr-full.pdf - Pages similaires..   Le défaut de.....l'affichage de référence des documents en format « pdf » au début de février 2001. « pdf » signifie « portable..

Requête = enfiroiper
Affichage =  ...Actualités des automates de recherche (moteurs de recherche) et des répertoires de recherche..
Google
Requête = googel [langue: français]
Affichage = aucun

Requête = googel site:www.dsi-info.ca
Affichage = aucun

Requête = google pdf dsi
Affichage = ... recherche ci-haut, nous pouvons remarquer que Google trie les ... travailler avec les commandes, utilisez filetype:pdf à la ... Service de recherche documentaire DSI. ...
Note: Googel se trouve dans la balise de cette page

Requête = enfiroiper
Affichage = [ test : enfiroiper ]Description, analyses et observations sur les moteurs de recherche et les répertoires. ... Enfiroiper ou enfirouaper signifie se faire rouler. ...
Note: La page contenant le mot « enfiroiper » uniquement de la balise n'a pas été affichée.
Inktomi
Requête = googel [langue: français]
Affichage = Description de la recherche de documents en format pdf par l'automate de recherche Googel.

Requête = enfiroiper
Affichage HotBot/MSN  = [ Test: enfiroiper ] Actualités des automates de recherche (moteurs de recherche) et des répertoires de recherche
Affichage HotBot/MSN = [ test : enfiroiper ]Description, analyses et observations sur les moteurs de recherche et les répertoires

    En matières de recherche, trois automates affichent les pages de test qu'ils ont indexées quelle que soit la situation : AltaVista, Gigablast et Inktomi.  AltaVista et Inktomi ont gardé la capacité de recherche dans la méta-description.   Ils demeurent les seuls automates de recherche à avoir survécu à la période sombre du web.  Gigablast a repris le flambeau sous cet aspect.
    AlltheWeb et Google ont en commun d'être suspicieux envers la méta-description, souvent source de spamindexation comme la balise « keyword ».  Tous deux affichent les pages seulement et seulement si elles sont uniques comme la page avec le mot «enfiroiper».  Les pages ayant un mot uniquement dans la balise disparaissent dès qu'elles entrent en concurrence, sauf lorsque le mot est aussi dans le corps du texte.  L'exemple de «googel » en témoigne, la page ne répondant pas à cette requête mais présente pour toutes les autres.  Cette particularité de ces deux automates pourrait être exploitée en utilisant des chaînes de caractères comme clé d'affichage. La seconde étape serait d'interdire l'accès à cette page aux autres automates en ajoutant une ligne dans la page «robot.txt», page qui contrôle l'indexation des robots indexeurs.
    La balise méta-description est encore un champ utile pour l'affichage et pour la recherche dans des cas très particuliers.  Elle est un champ latent qui pourrait reprendre du service si elle est utilisée dans un esprit de web sémantique et bien affichée. L'affichage d'AlltheWeb - balise description et mots en contexte - pourrait devenir un modèle.


Page précédente: Le champ Méta-titre
Retour au début de la page
Page suivante: Le champ Keywords

Service de recherche documentaire DSI. 1280-4, boulevard de Montarville. Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: info@dsi-info.ca
Adresse de cette page : Marc Duval. (Page créée le 1er août 2000).  «Langage de recherche: le champ langue». [En ligne]. Longueuil. Québec, ©2000-2003. http://www.dsi-info.ca/moteurs-de-recherche/langages/domaine-geographique.html
Cette page a été éditée le 1er août 2000.

Hit-Parade
©2000-2003. Marc Duval