Service de recherche documentaire
Service de recherche documentaire DSI
par Marc Duval, bibliothécaire

Google

et
la recherche d'images

Fiche technique
Google




Mise à jour: 2004-08-24

Bibliothèques (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web / ODP : recherche sur le Net / Toile du Québec : gestion de l'information ;  Internet - Guides ; guides perfectionnement à la recherche / Voila : internet - recherche d'info sur le web / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation / Pages jaunes : renseignements-service Longueuil ; Identificateurs : Description ; moteur de recherche ; Google


Accueil
Profil d'entreprise

Fiche technique de Google

Google et la recherche des documents pd

   Depuis janvier 2001, l'automate de recherche Google multiplie les nouveautés : formulaire de recherche en franglais, cartographie, dictionnaire, traduction et annuaire téléphonique dans la recherche en anglais, acquisition de Deja.com, recherche de documents PDF. Le 3 juin 2001, le formulaire franglais est amélioré et devient français. Le 12, Google met en ligne les versions canadienne anglaise et canadienne française.  Le 21 juin, la recherche d'images est ajoutée en mode bêta au formulaire de recherche avancée. Le 26 octobre la recherche d'images pour la version en français a son propre formulaire.  En début décembre, Google incorpore la recherche dans son catalogue d'images dans sa barre d'outils.  Depuis,  la recherche d'images n'a reçu aucune amélioration notable.

Le formulaire

    En donnant un formulaire à la recherche d'images en 2001, Google a redessiné sa page d'accueil sur laquelle figurent quatre onglets  dont celui de la recherche d'images qui conduit à sa propre page d'accueil.  L'adresse de cette page est  http://www.google.ca/imghp?hl=fr pour le Canada et http://www.google.fr/imghp?hl=fr pour la France. Tout comme la recherche web, la page a une case de recherche et un lien vers celle de la recherche avancée.  Le formulaire de recherche en anglais et en français sont identiques à un détail près.  Alors que le premier contient un filtre parental, le second en est dépourvu. C'est pourquoi il est plus sage d'utiliser l'interface en anglais pour éliminer les images indésirables.  Une seconde solution est d'utiliser la page de préférences en anglais.  La langue et l'activation du filtre parental y sont disponibles.


Opérateurs
Libellé/Formulaire
Libellé/Avancée
Exemple
ET tous les mots
Par défaut
carte ville Québec
OU au moins un mot
OR
carte OR plan
SANS aucun de ces mots
-
carte Québec -Province
PROXIMITÉ cette expression exacte
" "
"ville de Québec"
 
Nom du champ Préfixe de recherche Suffixe de fichier / Libellés
Exemple
Taille
Aucun
Afficher les images :
Petites, Moyennes, Grandes
Petites
Format
filetype: Renvoyer uniquement les images au format suivant :
JPG, GIF, NPG
filetype:jpg

JPG
GIF
NPG

Couleur
Aucun Renvoyer uniquement les images en :
Toutes les couleurs ; Noir et blanc ; Gris ; Couleur
Toutes les couleurs
Domaine
site: Renvoyer uniquement les images du site ou domaine
site:ca

 
Préférences
Langue de l'interface
Langue de recherche
Fenêtre de résultats
Montrer les résultats de recherche dans une nouvelle fenêtre de navigateur.
Format d'affichage Nbre d'images par pages Exemple
Aucun 20 ; 40 ; 60 ; 80 ; 100
20 résultats
Préférences en anglais seulement - Filtre parental
Nom du filtre
Choix
SafeSearch Filtering
-Use strict filtering (Filter both explicit text and explicit images)
-Use moderate filtering (Filter explicit images only - default behavior)
-Do not filter my search results

Le test

La recherche d'images a été introduite dans les formulaires anglais et français. L'adresse du formulaire canadien-anglais est http://www.google.ca/advanced_search?hl=en ; celle canadien-français est http://www.google.ca/advanced_search?hl=fr et la version en français du formulaire est http://www.google.fr/advanced_search?hl=fr (1) . Les tests ont porté sur ces requêtes: plan de la ville de Québec, Jean Chrétien, Bernard Landry, Stade olympique de Montréal, Rocher Percé, Île du Prince Édouard, Pierre Karl Péladeau, le lapin Bunny, Bonhomme Carnaval, l'eau embouteillée Naya et Yahoo. La recherche s'est faite avec un ou plusieurs mots. Les tests ont montré que Google est inconstant selon l'usage des accents.  Par exemple, les requêtes Québec, Quebec, Montréal et Montréal ont un nombre différent d'images trouvées.  De plus, la requête Québec a donné plus de pages que la requête Quebec; ce qui devrait être l'inverse.  L'usage des accents modifie aussi le classement.  Le signe + accolé au mot modifie l'ordre d'apparition des vignettes et en restreint le nombre au mot exact.  Cette inconstance ne couvre pas tous les mots accentués.  Cela pourrait rendre une recherche frustrante.

    Les recherches par champs site et type de fichier sont supportées mais pas celles du titre ni de l'URL. Toutefois,  l'utilisation des opérateurs booléens ( +  [ par défaut ], - et OR ) sont disponibles.  Une page « faq » complète le formulaire.

Le résultat de la recherche

    Le résultat de recherche est présenté en planches de vignettes groupées par 20 par page.  Bien que la page des préférences contienne l'option de modifier le nombre de vignettes par page, cette option est inopérante.

    Chaque vignette comprend le nom du fichier, sa taille et son adresse.  Les vignettes d'un même site sont groupées.

    L'affichage des pages offensantes est désactivé à partir de la page des préférences en anglais.  L'interface en anglais bénéficie de l'interrupteur Mature content filter is On que l'internaute peut faire basculer automatiquement vers la désactivation ( Mature content filter is Off ).

    Google ne fait aucune analyse d'images.  Le programme recherche des mots qui voisinent avec les images ou qui sont dans l'URL.  Les mots dans l'URL reliés par un trait de soulignement ne sont pas reconnus par Google; ce qui constitue du silence lorsque les mots de la requête ne sont pas dans la page.  C'est pourquoi les noms propres ou des mots précis (ex.: Buggs Bunny au lieu de lapin Bunny) sont efficaces à 80%.  Ce qui n'aide pas Google est que la majorité des images n'ont pas de texte alternatif.

    Google ne faisant aucune analyse d'images, il en résulte du bruit lorsque la page web comprend plusieurs sujets.  Les mots de la requête peuvent être n'importe où dans la page et sans relation avec les images.  Les carnets web sont un exemple de facteur de bruits.

    Ces deux lacunes reviennent aux concepteurs de pages web et aussi à Google qui n'a pas inclus les suggestions de recherche comme Lycos qui permet de trouver Buggs Bunny avec seulement le mot Bunny.

    Selon l'aide de Google en français, certaines requêtes feront apparaître des photos provenant des actualités.  Cet affichage est disponible seulement dans les versions en anglais de Google Images.

L'affichage des images

    L'internaute accède à la vignette-même en cliquant sur celle-ci.  La page d'informations de la vignette reprend les informations de la page du résultat de recherche.  Cette page d'informations est divisée en deux fenêtres horizontales. En haut se trouve la vignette en cache ou sauvegarder par Google, en bas la page web. La vignette est agrandie en cliquant dessus. Au-dessous de la vignette, il y a l'URL hyperliée de l'image originale ; la taille du fichier et l'adresse de l'image sont à droite. Dans le coin supérieur droit, le lien Supprimer ce cadre ou Remove frame ferme la fenêtre supérieure et agrandit la page web.  Un dernier lien retourne à la page du résultat de recherche.

    La page web est la page active, non la page en cache.  C'est pourquoi, l'image peut être disponible en cache et non sur la page web si elle a eu des modifications, si elle a été retirée du web ou déplacée.

La gestion des images

    Google a acquis la firme Picasa et le logiciel de gestion d'images du même nom.  Picasa est le compagnon de Google Images pour la gestion des images et aussi des vidéos.  Un lien pour le chargement gratuit du logiciel a été placé sur les interfaces en anglais et dans la page About Google.

Conclusion

    La recherche d'images de Google est minimale, sans aucune originalité.  Pire, elle ne propose aucune innovation, même dans son laboratoire.  D'autre part, Google n'a pas étendu son filtre parental à tous les sites nationaux, ce qui cause un sérieux problème d'éthique.  Par conséquent, son slogan La solution de recherche d'image la plus complète du Web n'est pas à la hauteur des attentes suscitées.


Voir la catégorie « Images » de Yahoo ! pour plus de « chercheurs d'images ».


Accueil
Haut de la page
Service de recherche documentaire DSI. 1280-4, boulevard de Montarville Boucherville. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: marcduval[at]dsi-info.ca
Adresse de cette page : Marc Duval. (Page créée le 22 juin 2001).  « Google : la recherche d'images ». [En ligne]. Boucherville. Québec, ©2001. http://www.dsi-info.ca/moteurs-de-recherche/Google/recherche-d-images.html
Cette page a été éditée le 23 juin 2001. 
©2001. Marc Duval.