Service de recherche documentaire
Service de recherche documentaire DSI 
par Marc Duval, bibliothécaire

Le langage
des automates de recherche:


Le champ de recherche Méta-titre
Dernière mise à jour 2003-06-25

duction
Opérateurs  booléens
Opérateurs de proximité
Troncature
Champs de recherche
Requêtes complexes
Conclusion
Formulaire de recherche
Tableaux
Les opérateurs logiques
Les champs de recherche
Affichage et fonctions

.
Accueil DSI
Introduction
La nature du web
Le mot clé
Les automates de recherche
-Les fiches techniques
-Le langage de recherche
Le classement des automates de recherche
Les répertoires
Les banques de données
Le web universitaire
Le palmarès des villes: un exemple de recherche
Le carnet de recherche
Les actualités
Les brèves

Commentaires
AltaVista est l'automate le plus performant dans la recherche par titre gâce à ses suggestions de recherche.


Conseils
Utilisez un préfixe par mot dans votre requête pour la plupart des automates de recherche.
Exemple:
title:moteur title:recherche


Avec Google, au lieu d'utiliser le préfixe intitle: devant chaque mot, utilisez allintitle: devant la requête
Exemple:
allintitle:moteur recherche


Avec le formulaire de recherche de Google, n'utilisez pas cette expression exacte pour une recherche dans le titre sauf s'il s'agit d'un nom propre composé.

Avec Gigablast, ajoutez le signe plus au préfixe de titre comme ceci: +title:


Champs et sites de recherche

    Les sites de recherche ont développé des préfixes de recherche comme nous l'avons vu avec AltaVista.  Le but de ce chapitre est d'identifier chacun de ces champs, leur utilisation et le préfixe correspondant utilisé par chacun des sites de recherche.
    Les champs de recherche sont aussi utilisés pour l'affichage.  C'est ce qui clora ce chapitre. En voici les parties:

1. - Les champs
     1.01    Champ Texte
        1.011    La casse
        1.012    Les signes diacritiques
        1.013    Le correcteur orthographique
        1.014    La taille du fichier
                    Tableau
    1.02    Champ Langue
    1.03    Champ Domaine géographique
    1.04    Champ Méta-titre
    1.05    Champ Méta-description
    1.06    Champ Meta Keywords (méta-mots)
    1.07    Champ URL
    1.08    Champ Serveur
    1.09    Champ Domaine de tête
    1.10    Champ Format de fichiers
    1.11    Champ Hyperlien
    1.12    Champ Dates
[en préparation]

2. - Affichage
    2.01    Les formats d'affichage
    2.02    Le tri


Le champ «titre» est celui le plus important, du moins en théorie.  Plus une banque de données est imposante, plus l'utilisation de champs précis comme le titre est utile.  Lorsque la recherche est infructueuse, l'utilisation de ce champ affichera toutes les pages dont les mots correspondront à la requête de titre.
    Ce chapitre tente d'analyser la performance de ce champ à travers dix requêtes à partir du formulaire et du préfixe, le cas échéant.
    Le champ « titre » correspond à la phrase contenue dans la balise méta-titre.  Il apparaît dans la barre de titre d'un fureteur et dans le résultat d'une recherche.

Schématiquement, voici une exemple d'une page:
DSI. Le langage de moteurs de recherche
<title>[Titre de la page provenant de la balise méta-titre]<\title»
[Barre de fonctions du fureteur]
[Texte]
Le langage des automates de recherche
..................

    La balise méta-titre doit avoir un identifiant pour faciliter le repérage dans le résultat d'une recherche.  L'identifiant dans l'exemple ci-dessus est DSI.  Les mots suivants doivent être usuels, même s'ils sont fautifs comme « moteurs de recherche », quitte à reprendre un terme plus juste comme « automates de recherche » dans le titre du texte.  En général, il correspond à celui de la page.
    Plusieurs webmestres font plus qu'optimiser le titre pour les automates de recherche.  Ils font ce que l'on appelle de la «spamindexation».  La spamindexation consiste à abuser du champ titre.  Jusqu'à maintenant les programmeurs des automates de recherche souffrent de laxisme en ne limitant pas le titre à 100 caractères, par exemple.  Certains webmestres en profitent.
    Voici quelques exemples d'abus du méta-titre.  Celui de la page d'accueil du site Fouille-tout est remarquable avec ces 3 062 caractères ou 405 mots.

1er exemple:
carton, caisse carton, emballage carton, emballage caisse, carton emballage, boite carton, carton déménagement, emballage déménagement
Titre de la page: Carton Service, l'emballage en direct
URL: http://www.cartonservice.fr/
Nombre de caractères: 120

    Vous remarquerez que le webmestre est sur la ligne de la spamdinxation dans la rédaction de la page en utilisant une couleur peu contrastante pour une liste de mots placée au début de la page et en petits caractères.

2ème exemple:
Web design, création conception sites web, la pocatiere, dubé, dube, L'inforoute de Rivière-du-Loup et Kamouraska, Création Dubé; Bas-St-Laurent - Céline, Dion, Céline, La Toile du Bas-Saint-Laurent - Bas-du-Fleuve Québec, Rimouski, Rivière-du-Loup, La Pocatière, Matane, Cabano
URL: http://www.creationdube.ca/
Titre de la page: Créations Dubé
Nombre de caractères: 244

3ème exemple:
menareport.com, Middle East & North African Business Report, provides up to date information on current events, headlines and news in the region's business, economic, financial and political spheres, covers key industries, and presents market research reports, market data and statistics for all countries, including Lebanon, Syria, Iraq, Jordan, Israel, Bahrain, Egypt, Iran, Kuwait, Libya, Morocco, Oman, Qatar, Saudi Arabia, Tunisia, Turkey, Yemen, Arab news, reported in English, Arabic and French
URL: http://www.menareport.com/index.php3?lang=f
Titre de la page:  Mena Report: le bulletin  des affaires économiques du Moyen Orient et de l'Afrique du Nord
Nombre de caractères: 432

4ème exemple:
Fouillez-tout, Fouillez !...vous trouverez!... L'Alternative des engins de recherche québécois !, engin, engin de recherche, recherche, moteur, moteur de recherche, engin québécois, engin de recherche québécois, moteur de recherche québécois, recherche québec, outil, outil de recherche, outil de recherche québécois, meta moteur, meta recherche, Engin de recherche, moteur de recherche, toile, web, toile francophone, français, France, francophone, franco-canadien, canadien-français, canadien de montréal, habs. Fouillez tout le Québec, région de québec, région, tout le web, le web, web, la toile, internet, l'internet. Trouvez, fouillez, trouver, fouiller, trouvé, fouillé, fouille, trouve, recherchez, rechercher, recherche, mp3, image, images, Ciné, video, cinéma, cinema, films, film, movie, movies, spectacle, spectacles, salle de spectacle, salle de cinéma, branchez-vous, directement, météo, meteo, tirage, sondage, survey, prix, prizes, indices boursiers, indice, indices, index, bourse, TSE, Toronto Stock Exchange, NASDAQ, Dow Jones, S&P500, répertoire, l'assurance, assurance, automobile, auto, car, véhicule, vehicule, maison, appartement, appartment, logement, location, achat, vente, acheter, vendre, à vendre, à louer, buy, sell, chalet, hôtels, hôtel, hotel, motel, motels, resto, restos, guide, guides, guide restaurants, restaurants, bed & breakfast, B&B, couettes et cafés, guide touristique, tourisme, guide touristique québec, tourisme québec, tourism, annonces classées, annonces, annonce, B to B, Business to business, b2b, emarketplace, e-marketplace, on-line, en ligne, on-line shopping, achat en ligne, dr fouyot, guides touristiques, québécois, wap, search, searching, cadeaux, cadeau, cartes, carte, maps, map, mapping, cartes géographiques. Meta search engine in Quebec, meta search, meta, weather, news, free, stock quotes information, insurance, life insurance, car insurance, home insurance, home, disability, group, annuities, annuity, hotels, Fouyot, e-greetings, carte de souhait, cartes de souhaits, sports, regional, regional search, arrivals, departures, montreal, montréal, mirabel, quebec, québec, web hosting, hosting, domaine, nom de domaine, domain, domain registration, free e-mail, courriel gratuit, courriel, région, régions, Abitibi-Témiscamingue, Bas-Saint-Laurent, Centre-du-Québec, Chaudières-Appalaches, Côte-Nord, Estrie, Gaspésie, Îles-de-la-Madeleine, Lanaudière, Laurentide, Laval, Mauricie, Montérégie, Nord-du-Québec, Outaouais, Ottawa, Saguenay, Saguenay-Lac-Saint-Jean, Lac-Saint-Jean, Hull, Aylmer, Gaspé, Percé, Rocher Percé, Gatineau, Sherbrooke, Magog, Drummondville, Saint-Jean, Saint-Jean-sur-Richelieu, Tadoussac, baleine, whale, whale watching, Charlevoix, Alma, Chicoutimi, Trois-Rivières, Cap-de-la-Madeleine, Shawinigan, Shawinnigan, Saint-Jérôme, Saint-Sauveur, Mont-Tremblant, Tremblant, Mont-Saint-Anne, radio, télévision, télé, journal, journaux, quotidien, magazine, magazinage, magazinage en ligne, shopping on-line, football, alouettes de montréal, montreal allouettes, baseball, expos, expos de montréal, montreal expos, hockey, canadien de montréal, montreal canadien, NHL, LNH, vieux montréal, vieux québec, gouvernement, old montreal, stade olympique, olympic stadium, golf, soccer, impact, l'impact, l'impact de montréal, montreal impact, a league, camping, hunting, chasse, pêche, chasse et pêche, actualité, habitation, transport, santé, hôpitaux, hôpital, aviation, voyage, travel
URL: http://www.fouillez-tout.com/
Titre de la page: Fouillez-tout.com.  L'Alternative des engins de recherche québécois !
Nombre de caractères: 3 062

    Quatre automates utilisent le formulaire et le préfixe de recherche: AlltheWeb, Google, Teoma et Tout le Web francophone (TWF)-Voila.  MSN et HotBot - tous deux avec Inktomi - ont la recherche avec le formulaire.  AltaVista et Gigablast ont choisi la recherche avec préfixes.
    Contrairement aux symboles des opérateurs booléens, il n'y a pas de consensus dans la nomination du préfixe « titre ».  Deux formes se concurrencent: title et intitle.  Google a une forme supplémentaire - allintitle: - qui recherche tous les mots le suivant.  Gigablast a une particularité: le signe + doit jouxter le préfixe.

    Voici le tableau des automates de recherche.  Les automates sont classés selon la présence du champ titre dans le formulaire et dans les préfixes de recherche.  

Automates de recherche Formulaires
Libellés
Préfixes
AlltheWeb Words Filters / in the title title:
Google en français Emplacement / dans le titre de la page intitle: / allintitle:
Google Occurences / in the title of the page intitle: / allintitle:
Teoma [in page title] intitle:
Tout le web francophone (Voila) Placés: [dans le titre] title:
MSN Search (Inktomi) en français Rechercher: [les mots du titre] n.d.
MSN Search (Inktomi) Find: [words in title] n.d.
HotBot (Inktomi) World Filtered / In the Title n.d.
AltaVista n.d title:
Gigablast n.d +title:
AntiSearch n.d n.d.
Exalead (AOL) n.d n.d.
WiseNut n.d n.d.
Northern Light s.o. s.o.
OpenFind s.o. s.o.

    L'analyse de ce champ a été faite à partir de 10 requêtes simples appliquées aux formulaires et aux préfixes.  Les requêtes comprennent 3 expressions afin de vérifier le comportement des automates.  Les 10 premières références du résultat de recherche de chaque automate ont été analysés.
    Voici la liste des requêtes: Céline Dion, chiens de prairie, cuir, déménagement, gîtes du Québec, Iraq, météo, Mustang, SRAS et vinyle.  Les groupes de mots - Céline Dion, chiens de pairies et gîtes du Québec - ont été utilisés pour vérifier le traitement des expressions.  Il est à noter que le français accepte usuellement l'orthographe Irak.
    L'automate le plus performant a été AltaVista.  Toutes les références avaient les mots de la requête.  Il a été particulièrement efficace avec les expressions.  L'une d'entre elles n'a donné aucune réponse.  AltaVista a proposé une modification de la requête.  Le défaut d'AltaVista est l'absence du champ dans le formulaire.
    Teoma, Gigablast et Voila se classent ex aequo en deuxième position.
    Tout le Web francophone (TWF) de Voila a une particularité avec l'intégration de son répertoire.  Plusieurs références de TWF n'avaient pas les mots de la requête dans le titre.  Cette absence est une illusion.  TWF fait la recherche dans le titre de la page mais affiche la notice de son répertoire, même si la notice n'a pas le mot dans le titre.  TWF n'a pas de recherche d'expression.
    HotBot et MSN suivent.  Bien qu'ils aient Inktomi en commun, trois requêtes ont eu un résultat différent.  MSN a été plus performant que HotBot à gérer les groupes de mots.  La raison en est que MSN n'a pas la recherche d'expression dans le titre dans son formulaire, le second l'a.  Pourtant, le résultat de MSN affiche plusieurs pages ayant « Céline Dion » en titre.  La requête « déménagement» a donné un résultat alors que MSN en signale plus de 2 500.  En retirant les accents, HotBot a donné plus de 2 300 références.   HotBot/Inktomi n'a donné aucune suggestion pour améliorer la recherche.
    AlltheWeb a faibli sur 3 questions: les gîtes du Québec, la météo et le SRAS.  Son formulaire a échoué à 2 requêtes et le préfixe à 3.

    Enfin, Google est l'automate le moins performant.  Il a deux handicaps: le classement PageRank et son formulaire fixe.  Son classement PageRank a pris le dessus 2 fois sur 10 avec le formulaire et 4 fois sur 10 avec le préfixe.  Son formulaire fixe ne permet pas d'apporter de la souplesse à la formulation d'une requête contrairement à AlltheWeb.

Conclusion:

    Le champ « titre » est le plus visible dans un résultat de recherche, c'est pourquoi il est le plus important.  L'internaute doit l'utiliser avec discernement en sachant que le texte libre prend plusieurs formes.  C'est ce que nous apprend la recherche de l'expression « gîtes du Québec ».  « gîtes au Québec », « gîtes Québec », « gîtes classifiés du Québec », « Gîtes et Auberges du Passant au Québec » sont autant d'expression pour la même réalité.  C'est pourquoi chaque mot d'une requête et même d'une expression doit être précédé du préfixe.  Tous les automates ont adopté cette approche.  Celui qui a le mieux répondu à la recherche d'expression est AltaVista, mais AltaVista n'a pas inclus ce champ dans son formulaire de recherche.  Seules les expressions figées telles que « chiens de prairie» sont recevables.
    Gigablast, Teoma et Voila ont les mieux réagi à ce champ.  Tous les trois ont en commun une petite banque de données.  Teoma et Voila ont su les mieux tirer leur épingle du jeu en intégrant le champ titre dans leur formulaire.
    Inktomi a été la surprise du test en ne donnant pas le même résultat sur MSN Search et sur HotBot.
    AlltheWeb a eu une très bonne note tandis que Google s'est révélé décevant dans son traitement en raison de l'interférence de son système de PageRank.



Page précédente: Le champ Domaine géographique
Retour au début de la page
Page suivante: Le champ Méta-description

Service de recherche documentaire DSI. 1280-4, boulevard de Montarville. Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: info@dsi-info.ca
Adresse de cette page : Marc Duval. (Page créée le 1er août 2000).  «Langage de recherche: le champ langue». [En ligne]. Longueuil. Québec, ©2000-2003. http://www.dsi-info.ca/moteurs-de-recherche/langages/domaine-geographique.html
Cette page a été éditée le 1er août 2000.

Hit-Parade
©2000-2003. Marc Duval