.
|
|
Champs
et sites de recherche
Les sites de recherche ont développé des préfixes
de recherche comme nous l'avons vu avec AltaVista. Le but de ce
chapitre est d'identifier chacun de ces champs, leur utilisation et le
préfixe correspondant utilisé par chacun des sites de
recherche.
Les champs de recherche sont aussi utilisés
pour l'affichage. C'est ce qui clora ce chapitre. En voici les
parties:
Le
champ « méta-description »
Le champ
méta-description a disparu de la recherche. Un vestige de
ce champ traine encore dans le formulaire de Toute le web francophone
du portail Voila. Voila
a gardé ce champ de recherche dans la liste déroulante
sous
la forme : placés dans les métas-descriptions. Ce
champ
du formulaire de recherche ne semble plus être
opérationnel. Malgré que ce champ ne soit plus
actif, la plupart des automates
l'indexent et l'affichent en tout ou en partie.
Un test sur la méta-description a
été mené sur AlltheWeb, AltaVista, Gigablast,
Google, HotBot-Inktomi, HotBot-MSN, Teoma, Tout le web francophone
(TWF) de Voila et WiseNut. Le test a porté sur deux mots :
googel et enfiroiper. Pour distinguer le mot « enfiroiper
» mis dans la balise « keyword », il a
été placé au début de la balise Description
entre crochets sous cette forme: [ test : enfiroiper ].
Voici le tableau indiquant l'indexation de la page
par les automates et la prise en compte de la recherche dans la
méta-description. Dans les exemples ci-dessous, «
googel» est seulement dans
la balise Description d'une page et dans le corps d'une autre page
uniquement. Dans l'exemple « enfiroiper », le mot est
uniquement
dans la méta-description de trois pages et dans le corps et la
balise
d'une page. Le test est validé lorsque l'automate affiche
une
page ayant le mot uniquement dans la balise. Les automates de
recherche fournissent des résultats inégaux.
L'entrée de nouvelles pages, les périodes de pointe
de recherche et les modifications des algorithmes sont des facteurs
influançant leur comportement. Ces deux tests sont des
indicateurs.
|
googel
|
enfiroiper
|
|
Page
|
Description
|
Page
|
Description
|
AllheWeb
|
Oui
|
Non
|
Oui
|
Non*
|
AltaVista
|
Oui
|
Oui
|
Oui
|
Oui
|
Gigablast
|
Oui
|
Oui
|
Non
|
Non
|
Google
|
Oui
|
Non
|
Oui
|
Non*
|
Inktomi (HotBot/MSN)
|
Oui
|
Oui
|
Oui
|
Oui
|
Teoma
|
Non
|
Non
|
Non
|
Non
|
TWF (Voila)
|
Oui
|
Non
|
Oui
|
Non
|
WiseNut
|
Non
|
Non
|
Non
|
Non
|
*
Le mot apparaît dans la balise description et dans le corps du
texte.
Lorsque le mot de la requête
est uniquement dans la balise «Description»,
- AlltheWeb affiche la notice seulement si elle est
unique. Dès qu'il y a une page d'un autre site, elle
disparaît. AlltheWeb est le seul automate qui utilise
nommément le champ «Description».
- AltaVista affiche la notice et une ligne provenant de
la balise «Description» avec d'autres pages dans le format
du mot en contexte sans identifier la provenance.
L'affichage a une ligne de la balise Description et une ligne du
texte contenant les mots
de la requête ou la première ligne du texte.
- Gigablast affiche la notice et une ligne de la
méta-description sans identifier la provenance dans le format du
mot en contexte.
- Google affiche la notice seulement si elle est unique.
Dès qu'il y a une page d'un autre site, la notice
disparaît. L'extrait de la
balise «Description» est affiché sans
identifier la provenance dans le format du mot en contexte lorsque la
requête donne une ou des réponses provenant du même
site.
- Inktomi - HotBot et MSN - affiche la notice et le
contenu de la balise «Description» avec d'autres pages sans
identifier la provenance. S'il y a un des mots de la
requête dans le texte, le format en contexte est affiché.
Voici comment chacun d'eux affiche
la partie de la notice:
AltaVista
Requête = googel host:www.dsi-info.ca
Affichage = Description de la recherche de
documents en format pdf par l'automate de recherche Googel. ...
SERVICE DE
RECHERCHE DOCUMENTAIRE par Marc Duval, bibliothécaire Google et
la
recherche de documents «pdf ...
Requête = enfiroiper
Affichage = test : enfiroiper ]Description,
analyses et observations sur les moteurs de recherche et les
répertoires ... DSI. Le carnet des sites de recherche par Marc
Duval Service de recherche documentaire DSI ...
|
AlltheWeb
Requête = googel [langue : français]
Affichage = Aucun
Requête = googel pdf dsi
Affichage = ... Accueil DSI
... info.ca/moteurs-de-recherche.pdf
[champ Serveur] dsi-info
[requête => host:dsi ...
domain:ca] [champ URL] dsi-info.ca/moteurs-de-recherche.pdf [requête => url:"moteurs ...
Description: Guide du langage d'interrogation des moteurs de
recherche. Description des champs de recherche.
Requête = google pdf dsi
Affichage = ... bibliothécaire Google
et la recherche de documents «pdf»
Fiche ... sowc2002-fr-full.pdf -
Pages similaires Le défaut de Google
est de ne pas donner ... 2001. http://www.dsi-info.ca/moteurs-de-recherche/Google/reche rche-d-images ...
Description: Description de la recherche de documents en format pdf par l'automate de recherche Googel.
Note: l'affichage en gras des mots dans la balise Description est
aléatoire. Cette balise n'a pas valeur de classement.
Requête = enfiroiper
Affichage = ... faire dans un délai de 24 h avec la
requête « enfiroiper
». Ni Google, ni AlltheWeb, ni Inktomi, ni Teoma ... de recherche
en utilisant une orthographe rare: enfiroiper.
Enfiroiper ou
enfirouaper signifie se faire rouler. Les deux ...
Description: [ test : enfiroiper
]Description, analyses et observations sur les moteurs de recherche et
les répertoires
|
Gigablast
Requête = googel pdf
Affichage = ...de documents en format pdf par l'automate de
recherche Googel.....SERVICE DE ..RECHERCHE ..DOCUMENTAIRE ..
par Marc.....PRENDRE L 'INITIATIVE ...
www.unicef.org/french/sowc02/pdf/sowc2002-fr-full.pdf - Pages
similaires.. Le défaut de.....l'affichage de
référence des documents en format « pdf » au
début de février 2001. « pdf »
signifie « portable..
Requête = enfiroiper
Affichage = ...Actualités des automates de recherche
(moteurs de recherche) et des répertoires de recherche..
|
Google
Requête = googel [langue: français]
Affichage = aucun
Requête = googel site:www.dsi-info.ca
Affichage = aucun
Requête = google pdf dsi
Affichage = ... recherche ci-haut, nous pouvons remarquer que Google
trie les ... travailler avec les commandes, utilisez filetype:pdf
à la ... Service de recherche documentaire DSI. ...
Note: Googel se trouve dans la balise de cette page
Requête = enfiroiper
Affichage = [ test : enfiroiper ]Description, analyses et
observations sur les moteurs de recherche et les répertoires.
... Enfiroiper ou enfirouaper signifie se faire rouler. ...
Note: La page contenant le mot « enfiroiper » uniquement de
la balise n'a pas été affichée.
|
Inktomi
Requête = googel [langue: français]
Affichage = Description de la recherche de documents en format pdf par
l'automate de recherche Googel.
Requête = enfiroiper
Affichage HotBot/MSN = [ Test: enfiroiper ]
Actualités des automates de recherche (moteurs de recherche) et
des répertoires de recherche
Affichage HotBot/MSN = [ test : enfiroiper
]Description, analyses et observations sur les moteurs de recherche et
les répertoires
|
En matières de recherche, trois automates affichent les pages de
test qu'ils ont indexées quelle que soit la situation :
AltaVista, Gigablast et Inktomi. AltaVista et Inktomi ont
gardé la capacité de recherche dans la
méta-description. Ils demeurent les seuls automates de
recherche à avoir survécu à la période
sombre du web. Gigablast a repris le flambeau sous cet aspect.
AlltheWeb et Google ont en commun d'être
suspicieux envers la méta-description, souvent source de
spamindexation comme la balise « keyword ». Tous deux
affichent les pages seulement et seulement si elles sont uniques comme
la page avec le mot «enfiroiper». Les pages ayant un
mot uniquement dans la balise disparaissent dès qu'elles entrent
en concurrence, sauf lorsque le mot est aussi dans le corps du texte.
L'exemple de «googel » en témoigne, la page ne
répondant pas à cette requête mais présente
pour toutes les autres. Cette particularité de ces deux
automates pourrait être exploitée en utilisant des
chaînes de caractères comme clé d'affichage. La
seconde étape serait d'interdire
l'accès à cette page aux autres automates en ajoutant une
ligne
dans la page «robot.txt», page qui contrôle
l'indexation
des robots indexeurs.
La balise méta-description est encore un
champ utile pour l'affichage et pour la recherche dans des cas
très particuliers. Elle est un champ latent qui pourrait
reprendre du service si elle est utilisée dans un esprit de web
sémantique et bien affichée. L'affichage d'AlltheWeb -
balise description et mots en contexte - pourrait devenir un
modèle.
|