SERVICE DE
RECHERCHE
DOCUMENTAIRE
Service de recherche documentaire DSI
par Marc Duval, bibliothécaire

Les langages
des automates de recherche:

Les opérateurs de proximité

Dernière mise à jour 2001-11-25

Introduction
Opérateurs  booléens
Opérateurs de proximité
Troncature
Champs de recherche
Requêtes complexes
Conclusion
Formulaire de recherche
Tableaux
Les opérateurs logiques
Les champs de recherche
Affichage et fonctions

.
Accueil
Introduction
La nature du web
Le mot clé
Les automates de recherche
-Les fiches techniques
-Les langages de recherche
Le classement des automates de recherche
Les répertoires
Les banques de données
Le web universitaire
Le palmarès des villes: un exemple de recherche
Le carnet de recherche
Les actualités
Les brèves
***
Lorsque vous faites une recherche d'une expression ou d'un nom propre,
utilisez cette syntaxe:
"mot mot"
ou
"Mot Mot"

***

Lorsque vous utilisez des expressions alphanumériques,
utilisez cette syntaxe:
"B2B"
(business to business)
"F1"
(course)
"G8"
"C++"*

*Les sites utilisant  Inktomi ne reconnaissent pas les symboles
mathématiques logiques encadrés par des guillemets anglais.


Les opérateurs de proximité

    Étant donné que notre recherche se fait dans un texte, les concepteurs des logiciels de recherche ont imaginé la notion de proximité.  Cette notion permet d'unir plusieurs termes en contexte. Le contexte est soit la phrase soit le paragraphe. La notion de proximité se décline en proximité proprement dite et en adjacence.  Selon les auteurs, ces deux notions sont interchangeables.  Dans le cadre de cette étude, l'opérateur de proximité relie deux mots côte-à-côte et l'opérateur d'adjacence deux mots séparés par au moins un autre mot.

L'opérateur de proximité

    Tous les automates de recherche ont l'opérateur de proximité.  Cet opérateur est représenté par les guillemets anglais « " " ». Par exemple, la recherche sur «talon d'achille» s'écrirait ainsi : "talon d'achille".  Les guillemets anglais sont utiles pour les expressions et pour les noms propres comme "Achille Talon". Sans les guillemets, vous auriez un résultat combinant l'histoire, la médecine et la bande dessinée ; avec les guillemets vous obtenez les documents sur le héros de la bande dessinée du même nom.  Cependant, chaque automate a son libellé.  Ce libellé est soit «expression» soit phrase chez les automates en anglais et «expression» chez les automates en français à l'exception de l'interface canadienne française qui utilise l'anglicisme «phrase».
    Chez AltaVista, tous les signes de ponctuation font office d'opérateur de proximité: trait d'union, apostrophe, virgule, point, etc.

L'opérateur d'adjacence

    En 2001, Lycos a remplacé son automate de recherche par Google.  Ce remplacement a été une grande perte.  L'automate de Lycos était le plus avancé.  Il avait développé quatre opérateurs: ADJ (adjacence), NEAR (près), FAR (distant de 25 mots maximum) et BEFORE (avant).  Il avait enfin une autre fonction avancée: l'ordre des mots.  En accolant la lettre «O» devant chacun des opérateurs, la recherche se faisait selon l'ordre exact des mots de la requête.
    Voila a aussi retiré son opérateur «NEAR» lors de sa mise-à-jour en juin 2002.
    Aujourd'hui, l'opérateur d'adjacence est réduit à unir deux mots séparés par plus d'un mot.  AltaVista est le seul à posséder un opérateur d'adjacence: NEAR.   En utilisant cet opérateur, la recherche se fera sur deux mots séparés d'au plus 10 mots en texte source.  Cela signifie que la ponctuation et les tableaux interfèrent dans la reconnaissance du groupe de mots.  Si le groupe de mots chevauche deux phrases, l'automate l'affichera.  Il en est ainsi pour les tableaux.  Si le groupe de mots est dans des cellules contiguës, l'automate l'affichera aussi.
    Voici un exemple de la recherche avec l'opérateur NEAR en utilisant AltaVista Avanced Search:

 (talon NEAR achille) AND (grec OR grecque)

    Cette requête a permis de trouver un texte qui avait cette phrase: « Pâris, aidé par Apollon, tuera Achille d'une flèche au talon. »

Source:
Taravella. (Page consultée le 19 novembre 2002). «La guerre de Troie». [En ligne]. http://www.ac-versailles.fr/pedagogi/anti/troie/troie0.htm

    Google possède aussi un opérateur d'adjacence officieux: l'astérisque.  L'astérisque remplace un mot et seulement un mot.  Pour remplacer deux mots, il faut deux astérisques et ainsi de suite.  Pour l'activer, il faut qu'il soit accompagné de l'opérateur de proximité. Voici trois exemples d'utilisation:

Exemple 1: "talon * achille" = 5 810 références
Exemple 2: "talon ** achille" = 498 références
Exemple 3: "talon *** achille" = 577 références

    Quel intérêt peut avoir une telle stratégie?
    Vous recherchez une adresse mais vous ne vous souvenez plus le nom exact de la rue.     Par exemple: «"rue * Matignon"».  Vous aurez le choix entre «rue de Matignon», «rue Gouyon Matignon» et «rue Camille Matignon».
    Vous avez une expression sur le bout de la langue: «... n'amasse pas ....» devient "n'amasse pas *".  Réponse: «Pierre qui roule n'amasse pas mousse».
    Vous recherchez des pages sur le président états-unien John Kennedy.  Pour avoir toutes les pages contenant «John F. Kennedy» et «John Fitzgerald Kennedy», entrez ceci: "John * Kennedy".
    Comme vous le voyez, les applications de cet opérateur d'adjacence sont nombreuses et efficaces.
    Attention!  L'astérisque est aussi utilisé comme opérateur de troncature chez Altavista.
    Pour compléter ce chapitre, voici le tableau des sites de recherche et de leurs opérateurs de proximité et d'adjacence.


Les automates de recherche

Proximité " " / Libellé
Adjacence
AlltheWeb " mot mot" /exact phrase
Non
AltaVista
"mot mot" / exactement cette expression
mot NEAR mot
AntiSearch
"mot mot" /  Non
Non
Gigablast
"mot mot" / this exact phrase
Non
Google
"mot mot" / cette expression exacte
"mot * mot"
HotBot.com
(Inktomi)
"mot mot" / exact phrase
phrase

Non
HotBot.fr
(Inktomi)
"mot mot" / expression exacte (accueil)
l'expression
(formulaire détaillé)
Non
MSN Search (Inktomi)
"mot mot" / l'expression exacte
Non
OpenFind
"mot mot" / Non
Non
Teoma
"mot mot" / Find this phrase
Non
Tout le web francophone (Voila)
"mot mot" / Non
Non
WiseNut
"mot mot" /  WITH this EXACT PHRASE
Non

Les répertoires

Proximité " " / Libellé
Adjacence
Nomade
(Fast Search)

"mot mot" / l'expression exact
Non
La Toile du Québec
(Google)
"mot mot" / Non
"mot * mot"
Yahoo.com seulement(1)
(Google)

"mot mot" / include this exact phrase(1)
"mot * mot"

Les portails

Proximité " " / Libellé
Adjacence
AOL Canada seulement(2)
(Google)

"mot mot" / Exact phrase(2)
"mot * mot"
AOL France
(Exalead - web français)

"mot mot" / Non
Non
Excite France
(Fast Search)

"mot mot" / Non
Non
GlobeTrotter
(Fast Search)

"mot mot" / Phrase
Non
Lycos France seulement(3)
(Fast Search)

"mot mot" / La phrase(3)
Non
Sympatico
(Google)

"mot mot" / L'expression exacte suivante
"mot * mot"


Page précédente: les opérateurs booléens
Accueil
Page suivante: L'opérateur de troncature


Service de recherche documentaire DSI. 1280-4, boulevard de Montarville Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: info@dsi-info.ca
Adresse de cette page : Marc Duval. (Page créée le 1er août 2000).  «Les opérateurs de proximité». [En ligne]. Longueuil. Québec, ©2000-2002. http://www.dsi-info.ca/moteurs-de-recherche/langages/operateurs-de-proximite.html
Cette page a été éditée le 1er août 2000.
Mots clés :  Bibliothèques  (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références  /  Nomade : recherche sur le Web / ODP :  recherche sur le Net /  Toile du Québec :  Internet - Guides ; guides perfectionnement à la recherche  / Voila :  internet - recherche d'info sur le web / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation

Hit-Parade
©2000-2002. Marc Duval