Service de recherche documentaire
Service de recherche documentaire DSI
 
par Marc Duval, bibliothécaire

Le langage
des automates de recherche:

Le champ de recherche

Langue

Dernière mise à jour 2003-04-22

Introduction
Opérateurs  booléens
Opérateurs de proximité
Troncature
Champs de recherche
Requêtes complexes
Conclusion
Formulaire de recherche
Tableaux
Les opérateurs logiques
Les champs de recherche
Affichage et fonctions

.
Accueil DSI
Introduction
La nature du web
Le mot clé
Les automates de recherche
-Les fiches techniques
-Le langage de recherche
Le classement des automates de recherche
Les répertoires
Les banques de données
Le web universitaire
Le palmarès des villes: un exemple de recherche
Le carnet de recherche
Les actualités
Les brèves

Conseils
AltaVista et Google ont des interfaces nationales, la recherche par langue, la recherche par pays et la recherche par domaine géographique.   Prenez soin de ne pas les confondre.

Lors de vos recherches, utilisez la langue correspondant à votre requête dans le formulaire de recherche.   

Les portails sont adaptés à leur clientèle.  Utlisez-les pour une recherche en français simple et efficace correspondant à votre pays.

Utilisez les sites des automates de recherche pour des recherches complexes comportant plus d'une langue..
Références
Codes des langues ISO 639
Organisation internationale de la francophonie
Index des codes domaines/pays d'Altavista


Champs et sites de recherche

    Les sites de recherche ont développé des préfixes de recherche comme nous l'avons vu avec AltaVista.  Le but de ce chapitre est d'identifier chacun de ces champs, leur utilisation et le préfixe correspondant utilisé par chacun des sites de recherche.
    Les champs de recherche sont aussi utilisés pour l'affichage.  C'est ce qui clora ce chapitre. En voici les parties:

1. - Les champs
     1.01    Champ Texte
        1.011    La casse
        1.012    Les signes diacritiques
        1.013    Le correcteur orthographique
        1.014    La taille du fichier
                    Tableau
    1.02    Champ Langue
    1.03    Champ Domaine géographique
    1.04    Champ Méta-titre
    1.05    Champ Méta-description
    1.06    Champ Meta Keywords (méta-mots)
    1.07    Champ URL
    1.08    Champ Serveur
    1.09    Champ Domaine de tête
    1.10    Champ Format de fichiers
    1.11    Champ Hyperlien
    1.12    Champ Dates
[en préparation]

2. - Affichage
    2.01    Les formats d'affichage
    2.02    Le tri


    Les automates de recherches ont reçu très tôt le champ «langue» dans leur trousseau.  C'est en  1997 qu'AltaVista a introduit la recherche dans vingt-cinq langues, soit un an après son apparition sur le web.  Les interfaces nationales apparaissent avec AltaVista Canada (anglais et français) dès 1998.  AltaVista France naîtra en 1999.
    Parmi les champs, celui de la langue est déterminant pour qui prétend à l'international.  Il ne suffit pas d'offrir la recherche par langue, encore faut-il que l'interface soit dans la langue de l'internaute.  Dans la décennie 90, AltaVista était le modèle sur lequel Google a édifié son empire.
    La recherche par langue se trouve dans le formulaire de recherche chez tous les automates d'envergure internationale.  Lorsque la langue est dans les préférences, un fichier témoin est placé sur l'ordinateur de l'internaute pour fixer la préférence linguistique.  Le fichier témoin est aussi d'usage pour AltaVista et Google qui ont des interfaces linguistiques.

AltaVista

    Chez AltaVista, la recherche par langue est signifiée dans la page d'accueil et dans le formulaire.  Il faut porter attention pour remarquer sa présence.  Le choix de la langue est sous le nom de la langue souligné en hyperlien.  Il est aussi dans le tableau des interfaces de pays de recherche.  En choisissant le pays de recherche, AltaVista présente par défaut la langue nationale et l'anglais.  Après le choix du pays, AltaVista propose la langue de l'interface de recherche.  Par exemple, l'internaute francophone peut faire une recherche dans le catalogue - ou l'index - coréen avec l'interface et la langue de recherche en français.  Le catalogue inclut toutes les pages du pays quel que soit le domaine et non seulement celles qui sont du domaine de pays.  Lorsque le choix de l'internaute est fait, le catalogue du pays et de la langue de recherche est affichée dans le formulaire.  Cela permet de faire des recherches dans des sites d'ambassades, d'organisations internationales, d'écoles, de commerces d'import/export... de pays francophones installés en Corée.  L'organisation internationale de la francophonie donne une liste de ses pays membres.
    En 2002, AltaVista a fait une refonte de son site.  Auparavant, AltaVista avait sont site d'origine en anglais et des sites nationaux séparés.  Aujourd'hui, le site original (www.altavista.com) a l'option d'interfaces dans toutes les langues disponibles tout en gardant les adresses des sites nationaux comme celui du Canada et de la France.
    Il est à noter qu'AltaVista n'a pas de préfixe de langue pour la recherche avancée.

   AltaVista a un traducteur appelé Babelfish.  Le lien du traducteur est activé dans les préférences.  Lorsque la référence est dans une autre langue que l'interface, le lien Traduction apparaît à la fin de la notice ou avant le lien pour développer toutes les pages du site de la référence.

Google

    Chez Google, la recherche par langue se trouve dans le formulaire de recherche avancée (advanced search), dans la page des préférences et dans celle des outils linguistiques (language tools).  Il affiche l'interface linguistique selon le paramètre de langues du fureteur.  Par défaut, la langue est l'anglais.  En plus du paramètre linguistique du fureteur, Google prend en compte l'adresse IP de votre ordinateur attribuée par votre fournisseur Internet.  Le fichier témoin est aussi mis en contribution pour fixer la langue comme c'est le cas avec le site canadien qui a deux interfaces.
    Mieux que tout autre, Google a compris la relation entre l'internaute et l'interface de recherche.  C'est pourquoi la société a mis en ligne le plus grand réseau de sites régionaux avec plus de cinquantes interfaces.  A côté des interfaces nationales et territoriales, il a développé des interfaces linguistiques avec la participation de traducteurs volontaires.  L'esprit espiègle de Google se manifeste dans des interfaces originales sinon insolites comme celles en klingon, ce qui le rend sympathique.
    Dans le cas de la recherche linguistique au Canada, il est préférable d'utiliser le formulaire.  En effet, Google met trois choix: recherche «web», «pages francophones» et «Canada», mais pas «pages francophones au Canada».
    L'interface française a un défaut similaire.  Elle donne le choix entre les pages web, les pages francophones et les pages de la France.  La recherche dans les pages françaises fait ressortir des pages du Canada comme dans cette recherche sur «Québec».
    Google a un traducteur dans sa page d'outils linguistiques.  Le lien [traduire cette page] est activé automatiquement en fonction de la langue de la recherche.  Ainsi, la recherche avec l'interface canadienne française fera apparaître le lien lors de la recherche sur le web en entier.
    Google n'a pas de préfixe de recherche pour la recherche avancée.

Inktomi

    Inktomi fait partie de la vieille garde.  Avant qu'il ne se révèle sur le nouveau HotBot, il était en marque blanche sur plusieurs sites dont HotBot et notamment sur les portails comme MSN.  La recherche par langue est introduite dans le formulaire de recherche.  Sur HotBot France, elle est sur le formulaire simplifié de la page d'accueil et sur celui développé.  Inktomi s'adapte au site qu'il dessert.  Sur HotBot, il offre la recherche dans trente-cinq langues; sur MSN, quinze langues et sur HotBot France, neuf.  MSN pallie le nombre de langues offerts par celui de ses portails nationaux avec trente-deux.

AlltheWeb

    AlltheWeb a une fonction de détection des langues automatiques basée sur la préférence du fureteur et l'adresse IP.  Par défaut, la langue est l'anglais.  La recherche par langue est directement sur la page d'accueil.  L'internaute y accède en sélectionnant la langue hyperliée.   Ceci l'amène à la page des préférences linguistiques.
    AlltheWeb propose quarante-neuf langues.  L'internaute peut sélectionner jusqu'à huit langues.  Il peut raffiner la recherche linguistique en sélectionnant les pages encodées selon les normes ISO et selon quelqu'unes nationales.

    Le champ «langue» du formulaire de recherche est identifié par Language.  L'internaute d'expérience pourra utiliser le préfixe «language:» suivi immédiatement par la langue en toute lettre ou en utilisant le code de pays ISO pour la recherche avancée tel que fourni par AltaVista.

Teoma

    Teoma a reçu le champ «langue» en 2002 dans son formulaire de recherche.  Ce champ est identifié par «language».  Il comprend dix langues.
    Son préfixe de recherche est «lang:» suivi immédiatement par la langue en toute lettre ou en utilisant le code de pays ISO (allemand/DE, anglais/EN, danois/DA, espagnol/ES, français/FR, italien/IT, néerlandais/NL, norvégien/NO, portugais/PT et suédois/SV).

WiseNut

    WiseNut n'a pas de champ de recherche linguistique dans son formulaire de recherche.  L'internaute doit se rendre sur la page des préférences pour choisir sa langue de recherche parmi les vingt-cinq proposées.   Toutes les langues peuvent être sélectionnées.
    WiseNut n'a pas de préfixe de langue.

Conclusion

   La présence de la recherche par langue est discrète sur la page d'accueil de tous les automates de recherche.  AltaVista et AlltheWeb ont un hyperlien au nom de la langue active.  Chez Google, elle est signalée par «Language tools».  Chez HotBot, Teoma et WiseNut, il n'y a aucune mention.  Dans tous les cas, il faut se rendre dans le formulaire de recherche pour accéder à la recherche par langue.

  Si nous observons les automates en fonction des interfaces linguistiques, trois se détachent nettement: AltaVista, Google et Inktomi.
  AltaVista et Google déclinent leur offre en interfaces nationales et en recherche linguistique. Quant à Inktomi, il est présent sur plusieurs sites et il s'est affiché récemment sur HotBot - auparavant, Inktomi était en fusion avec HotBot.  Ces sociétés ont reconnu que la recherche par langue est déterminante pour qui prétend à la suprématie.

   Google et AltaVista sont les seuls dans cette catégorie à compléter leur offre avec un traducteur automatique.

   Google a ajouté une touche supplémentaire qui en fait le numéro un: un correcteur d'orthographe et un dictionnaire en ligne.  Google n'a pas fini son développement.  Encore faut-il qu'il ajoute les mêmes services dans d'autres langues.  Le correcteur est disponible en français mais pas le dictionnaire.

   AlltheWeb est le prétendant le plus sérieux à rejoindre le triumvirat.  Depuis 2002, il prend les bouchées doubles en ajoutant en autre un préfixe de recherche par langue et un dictionnaire.  Il lui manque encore un correcteur d'orthographe qui ne saurait tarder.  Il lui faudrait des efforts supplémentaires pour atteindre son but et de l'imagination.  Par exemple, il aurait avantage à identifier sur son site les portails nationaux comme Globetrotter et Excite France pour pallier sa carence en matière d'interfaces linguistiques.
 En ayant des interfaces linguistiques en propre, AlltheWeb pourra rallier les internautes autant néophytes qu'expérimentés.
   Teoma et WiseNut ont le défaut d'être uniquement un site de recherche états-unien.  Ils n'ont aucune interface nationale et ils ne sont sur aucun portail.  Ils ne peuvent concurrencer Google que sur le marché anglophone, plus particulièrement aux États-Unis.  WiseNut a un mince avantage sur Teoma s'il était déployé sur le réseau de LookSmart, son propriétaire.  Son avantage aurait été d'autant plus grand si LookSmart n'avait pas fermé son site français.
    Enfin, du côté des automates uniquement en français, celui de Voila est prédominant avec son service de traduction pour le web mondial.

Les automates

Automates
Libellé
Préfixes
Nombre de langues
Interfaces
Traducteur
AltaVista
Résultats en
Non
25
25
Oui
Incorporé au résultat
Google


Google en français
Return pages written in

Résultats pour les pages écrites en
Non
35
86 /
63 nationales

Oui
Incorporé au résultat

Inktomi
(HotBot)

Language
Non
35
7
Non
Inktomi
(HotBot France)
Langue
Non
9

Non
MSN Search
(Inktomi)

Language
Langue

Non
15
32
Non
Voila pour les geeks
Aucun
Non
5
5

Interfaces en anglais
AlltheWeb
(Fast Search)
Language
language:french
language:fr
49/
54 avec Unicode

Anglais
Non
Gigablast
Aucun
Non
1
Anglais
Non
Northern Light
Documents written in:
Non
5
Anglais
Non
Teoma
Language
lang:french
lang:fr

10
Anglais
Non
WiseNut
Languages
Non
25
Anglais
Non
Interfaces en français
AntiSearch
Tout le web francophone
Non
1
Français
Non
Exalead
(AOL)
Web français
Web mondial

Non
1
Français
Non
Tout le web francophone
(Voila)
Aucun
Non
1
Français
Oui
Incorporé au résultat



Page précédente: Les opérateurs de troncature
Retour au début de la page
Page suivante: Le domaine géographique

Service de recherche documentaire DSI. 1280-4, boulevard de Montarville. Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: info@dsi-info.ca
Adresse de cette page : Marc Duval. (Page créée le 1er août 2000).  «Langage de recherche: le champ langue». [En ligne]. Longueuil. Québec, ©2000-2003. http://www.dsi-info.ca/moteurs-de-recherche/langages/champ-de-recherche-langue.html
Cette page a été éditée le 1er août 2000.

Hit-Parade
©2000-2003. Marc Duval