Le
champ «titre» est celui le plus important, du moins en
théorie. Plus une banque de données est imposante,
plus l'utilisation de champs précis comme le titre est
utile. Lorsque la recherche est infructueuse, l'utilisation de ce
champ affichera toutes les pages dont les mots correspondront à
la requête de titre.
Ce chapitre tente d'analyser la
performance de ce champ à travers dix requêtes à
partir du formulaire et du préfixe, le cas échéant.
Le champ « titre »
correspond à la phrase contenue dans la balise
méta-titre. Il apparaît dans la barre de titre d'un
fureteur et dans le résultat d'une recherche.
Schématiquement, voici une exemple d'une page:
DSI. Le
langage de moteurs de recherche
<title>[Titre de la page
provenant de la balise méta-titre]<\title»
|
|
[Barre de
fonctions du fureteur]
|
[Texte]
Le langage
des
automates de recherche
..................
|
La balise méta-titre doit avoir un identifiant pour faciliter le
repérage dans le résultat d'une recherche.
L'identifiant dans l'exemple ci-dessus est DSI. Les mots
suivants doivent être usuels, même s'ils sont fautifs comme
« moteurs de recherche », quitte à reprendre un
terme plus juste comme « automates de recherche » dans le
titre du texte. En général, il correspond à
celui de la page.
Plusieurs webmestres font plus qu'optimiser le titre
pour les automates de recherche. Ils font ce que l'on appelle de
la «spamindexation». La spamindexation consiste
à
abuser du champ titre. Jusqu'à maintenant les programmeurs
des automates de recherche souffrent de laxisme en ne limitant pas le
titre
à 100 caractères, par exemple. Certains webmestres
en
profitent.
Voici quelques exemples d'abus du
méta-titre. Celui de la page d'accueil du site
Fouille-tout est remarquable avec ces 3 062 caractères ou 405
mots.
1er exemple:
carton, caisse carton, emballage carton,
emballage caisse, carton emballage, boite carton, carton
déménagement, emballage déménagement
Titre de la page: Carton Service,
l'emballage en direct
URL: http://www.cartonservice.fr/
Nombre de caractères: 120
Vous remarquerez que le webmestre est sur la ligne de la spamdinxation
dans la rédaction de la page en utilisant une couleur peu
contrastante pour une liste de mots placée au début de la
page et en petits
caractères.
2ème exemple:
Web design, création conception sites web, la pocatiere,
dubé, dube, L'inforoute de Rivière-du-Loup et Kamouraska,
Création Dubé; Bas-St-Laurent - Céline, Dion,
Céline, La Toile du Bas-Saint-Laurent - Bas-du-Fleuve
Québec, Rimouski, Rivière-du-Loup, La Pocatière,
Matane, Cabano
URL: http://www.creationdube.ca/
Titre de la page: Créations
Dubé
Nombre de caractères: 244
3ème exemple:
menareport.com, Middle East & North African Business Report,
provides up to date information on current events, headlines and news
in the region's business, economic, financial and political spheres,
covers key industries, and presents market research reports, market
data and statistics for all countries, including Lebanon, Syria, Iraq,
Jordan, Israel, Bahrain, Egypt, Iran, Kuwait, Libya, Morocco, Oman,
Qatar, Saudi Arabia, Tunisia, Turkey, Yemen, Arab news, reported in
English, Arabic and French
URL:
http://www.menareport.com/index.php3?lang=f
Titre de la page: Mena Report: le
bulletin des affaires économiques du Moyen Orient et de
l'Afrique du Nord
Nombre de caractères: 432
4ème exemple:
Fouillez-tout, Fouillez !...vous trouverez!... L'Alternative des engins
de recherche québécois !, engin, engin de recherche,
recherche, moteur, moteur de recherche, engin québécois,
engin de recherche québécois, moteur de recherche
québécois, recherche québec, outil, outil de
recherche, outil de recherche québécois, meta moteur,
meta recherche, Engin de recherche, moteur de recherche, toile, web,
toile francophone, français, France, francophone,
franco-canadien, canadien-français, canadien de montréal,
habs. Fouillez tout le Québec, région de québec,
région, tout le web, le web, web, la toile, internet,
l'internet. Trouvez, fouillez, trouver, fouiller, trouvé,
fouillé, fouille, trouve, recherchez, rechercher, recherche,
mp3, image, images, Ciné, video, cinéma, cinema, films,
film, movie, movies, spectacle, spectacles, salle de spectacle, salle
de cinéma, branchez-vous, directement, météo,
meteo, tirage, sondage, survey, prix, prizes, indices boursiers,
indice, indices, index, bourse, TSE, Toronto Stock Exchange, NASDAQ,
Dow Jones, S&P500, répertoire, l'assurance, assurance,
automobile, auto, car, véhicule, vehicule, maison, appartement,
appartment, logement, location, achat, vente, acheter, vendre, à
vendre, à louer, buy, sell, chalet, hôtels, hôtel,
hotel, motel, motels, resto, restos, guide, guides, guide restaurants,
restaurants, bed & breakfast, B&B, couettes et cafés,
guide touristique, tourisme, guide touristique québec, tourisme
québec, tourism, annonces classées, annonces, annonce, B
to B, Business to business, b2b, emarketplace, e-marketplace, on-line,
en ligne, on-line shopping, achat en ligne, dr fouyot, guides
touristiques, québécois, wap, search, searching, cadeaux,
cadeau, cartes, carte, maps, map, mapping, cartes géographiques.
Meta search engine in Quebec, meta search, meta, weather, news, free,
stock quotes information, insurance, life insurance, car insurance,
home insurance, home, disability, group, annuities, annuity, hotels,
Fouyot, e-greetings, carte de souhait, cartes de souhaits, sports,
regional, regional search, arrivals, departures, montreal,
montréal, mirabel, quebec, québec, web hosting, hosting,
domaine, nom de domaine, domain, domain registration, free e-mail,
courriel gratuit, courriel, région, régions,
Abitibi-Témiscamingue, Bas-Saint-Laurent,
Centre-du-Québec, Chaudières-Appalaches, Côte-Nord,
Estrie, Gaspésie, Îles-de-la-Madeleine, Lanaudière,
Laurentide, Laval, Mauricie, Montérégie,
Nord-du-Québec, Outaouais, Ottawa, Saguenay,
Saguenay-Lac-Saint-Jean, Lac-Saint-Jean, Hull, Aylmer, Gaspé,
Percé, Rocher Percé, Gatineau, Sherbrooke, Magog,
Drummondville, Saint-Jean, Saint-Jean-sur-Richelieu, Tadoussac,
baleine, whale, whale watching, Charlevoix, Alma, Chicoutimi,
Trois-Rivières, Cap-de-la-Madeleine, Shawinigan, Shawinnigan,
Saint-Jérôme,
Saint-Sauveur, Mont-Tremblant, Tremblant, Mont-Saint-Anne, radio,
télévision, télé, journal, journaux,
quotidien, magazine, magazinage,
magazinage en ligne, shopping on-line, football, alouettes de
montréal,
montreal allouettes, baseball, expos, expos de montréal,
montreal
expos, hockey, canadien de montréal, montreal canadien, NHL,
LNH,
vieux montréal, vieux québec, gouvernement, old montreal,
stade olympique, olympic stadium, golf, soccer, impact, l'impact,
l'impact
de montréal, montreal impact, a league, camping, hunting,
chasse,
pêche, chasse et pêche, actualité, habitation,
transport,
santé, hôpitaux, hôpital, aviation, voyage, travel
URL: http://www.fouillez-tout.com/
Titre de la page: Fouillez-tout.com.
L'Alternative des engins de recherche québécois !
Nombre de caractères: 3 062
Quatre automates utilisent le formulaire et le préfixe de
recherche: AlltheWeb, Google, Teoma et Tout le Web francophone
(TWF)-Voila. MSN et HotBot - tous deux avec Inktomi - ont la
recherche avec le formulaire. AltaVista et Gigablast ont choisi
la recherche avec préfixes.
Contrairement aux symboles des opérateurs
booléens, il n'y a pas de consensus dans la nomination du
préfixe « titre ». Deux formes se
concurrencent: title et intitle. Google a une forme
supplémentaire - allintitle: - qui recherche tous les mots le
suivant. Gigablast a une particularité: le signe + doit
jouxter le préfixe.
Voici le tableau des automates de
recherche. Les automates sont classés selon la
présence du champ titre dans le formulaire et dans les
préfixes de recherche.
Automates de recherche |
Formulaires
Libellés |
Préfixes |
AlltheWeb |
Words Filters / in the title |
title: |
Google en français |
Emplacement / dans le titre de la page |
intitle: / allintitle: |
Google |
Occurences / in the title of the page |
intitle: / allintitle: |
Teoma |
[in
page title] |
intitle: |
Tout le web francophone (Voila) |
Placés: [dans le titre] |
title: |
MSN Search (Inktomi) en
français |
Rechercher: [les mots du titre] |
n.d. |
MSN Search (Inktomi) |
Find: [words in title] |
n.d. |
HotBot (Inktomi) |
World Filtered / In the Title |
n.d. |
AltaVista |
n.d |
title: |
Gigablast |
n.d |
+title: |
AntiSearch |
n.d |
n.d. |
Exalead (AOL) |
n.d |
n.d. |
WiseNut |
n.d |
n.d. |
Northern Light |
s.o. |
s.o. |
OpenFind |
s.o. |
s.o. |
L'analyse de ce champ a été faite à partir de 10
requêtes simples appliquées aux formulaires et aux
préfixes.
Les requêtes comprennent 3 expressions afin de vérifier le
comportement des automates. Les 10 premières
références
du résultat de recherche de chaque automate ont
été
analysés.
Voici la liste des requêtes: Céline
Dion, chiens de prairie, cuir, déménagement, gîtes
du Québec, Iraq, météo, Mustang, SRAS et
vinyle. Les groupes de
mots - Céline Dion, chiens de pairies et gîtes du
Québec
- ont été utilisés pour vérifier le
traitement
des expressions. Il est à noter que le français
accepte
usuellement l'orthographe Irak.
L'automate le plus performant a été
AltaVista. Toutes les références avaient les mots
de la requête. Il a été
particulièrement efficace avec les expressions. L'une
d'entre elles n'a donné aucune réponse. AltaVista a
proposé une modification de la requête. Le
défaut d'AltaVista est l'absence du champ dans le formulaire.
Teoma, Gigablast et Voila se classent ex aequo en
deuxième position.
Tout le Web francophone (TWF) de Voila a une
particularité avec l'intégration de son
répertoire. Plusieurs références de TWF
n'avaient pas les mots de la requête dans le titre. Cette
absence est une illusion. TWF fait la recherche dans le titre de
la page mais affiche la notice de son répertoire, même si
la notice n'a pas le mot dans le titre. TWF n'a pas de recherche
d'expression.
HotBot et MSN suivent. Bien qu'ils aient
Inktomi en commun, trois requêtes ont eu un résultat
différent. MSN a été plus performant que
HotBot à gérer
les groupes de mots. La raison en est que MSN n'a pas la
recherche
d'expression dans le titre dans son formulaire, le second l'a.
Pourtant,
le résultat de MSN affiche plusieurs pages ayant «
Céline
Dion » en titre. La requête «
déménagement»
a donné un résultat alors que MSN en signale plus de 2
500. En retirant les accents, HotBot a donné plus de 2 300
références. HotBot/Inktomi n'a donné
aucune suggestion pour améliorer la recherche.
AlltheWeb a faibli sur 3 questions: les gîtes
du Québec, la météo et le SRAS. Son
formulaire a échoué à 2 requêtes et le
préfixe à 3.
Enfin, Google est l'automate le moins
performant. Il a deux handicaps: le classement PageRank et son
formulaire fixe. Son classement PageRank a pris le dessus 2 fois
sur 10 avec le formulaire et 4 fois sur 10 avec le
préfixe. Son formulaire fixe ne permet pas d'apporter de
la souplesse à la formulation d'une requête contrairement
à AlltheWeb.
Conclusion:
Le champ « titre » est le plus visible dans un
résultat
de recherche, c'est pourquoi il est le plus important.
L'internaute
doit l'utiliser avec discernement en sachant que le texte libre prend
plusieurs formes. C'est ce que nous apprend la recherche de
l'expression « gîtes du Québec ».
« gîtes au Québec », « gîtes
Québec », « gîtes classifiés du
Québec », « Gîtes et Auberges du Passant au
Québec » sont autant d'expression pour la même
réalité. C'est pourquoi chaque mot d'une
requête et même d'une expression doit être
précédé du préfixe. Tous les
automates ont adopté cette approche. Celui qui a le mieux
répondu à la recherche d'expression est AltaVista, mais
AltaVista n'a pas inclus ce champ dans son formulaire de
recherche. Seules les expressions figées telles que
« chiens de prairie» sont recevables.
Gigablast, Teoma et Voila ont les mieux réagi
à ce champ. Tous les trois ont en commun une petite banque
de données. Teoma et Voila ont su les mieux tirer leur
épingle du jeu en intégrant le champ titre dans leur
formulaire.
Inktomi a été la surprise du test en
ne donnant pas le même résultat sur MSN Search et sur
HotBot.
AlltheWeb a eu une très bonne note tandis que
Google s'est révélé décevant dans son
traitement en raison de l'interférence de son système de
PageRank.
|