SERVICE
DE RECHERCHE DOCUMENTAIRE Marc Duval, bibliothécaire |
Copernic Agent Professional, l'agent semi-professionnel | 2002-11-04 |
En
1996, la société québécoise Agent Technologies
Corporation entrait sur la scène de l'Internet. En 1997, elle
lance son métamoteur Copernic. Sa mission: explorer le web à
travers une dizaine des principaux sites de recherche. En moins
d'un mois, la société lance une nouvelle version qui intègre
son métachercheur à Internet Explorer de Microsoft. Les
principales caractéristiques du logiciel Copernic sont: agrégation
du résultat de recherche des principaux sites de recherche, élimination
des doublons et les liens morts, sauvegarde des requêtes et des résultats
de recherche, classement des références par pertinence et par
divers critères de tri. Dès son arrivée, il reçoit
éloges et prix.
L'année suivante, Agent Technologies étend la recherche sur
33 sites regroupés par domaines: actualités, affaires, courriels,
divertissement, gouvernement, informatique, sport et voyage. Quelques
mois plus tard, des améliorations sont apportées à l'interface
telles qu'un assistant de recherche et le partage amélioré
des résultats de recherche en différents formats de fichiers.
L'algorithme est aussi bonifié. Le nombre de sites de
recherche est augmenté à 125. Les neuf faiblesses sont:
Les faiblesses de Copernic Agent Professional1. La limitation du langage de rechercheLa principale faiblesse de Copernic est sa limitation du langage de recherche. Copernic n'exploite pas ce qui fait la richesse des langages de recherche. Son langage se résume aux opérateurs booléens de base: ET, OU, expression. On remarquera qu'il n'a pas l'exclusion ni d'opérateur d'adjacence. Dans ces conditions, nous ne pouvons pas faire des recherches spécifiques et se rendre dans les recoins d'une banque de données. Les stratégies de recherche sont limitées aux algorithmes des automates de recherche. Aucune recherche en profondeur ne peut être faite. L'utilisation du langage est réservée au résultat de la recherche dans lequel l'exclusion est présente. 2. L'absence de recherche par champs
La recherche par champs est une fonction importante pour des recherches au-delà
du bon vouloir de l'automate. En se privant de cette fonction, Copernic
ne permet pas de rechercher uniquement par titres, par sites, par domaines,
par mots dans l'URL ni par hyperliens ou par hypertexte, ni par fichiers
multimédias intégrés à une page web et encore moins par formats comme les «pdf». 3. Déficience de la gestion des pages identiquesCopernic met dans ses atouts la suppression des pages identiques. Il est vrai qu'il fait la suppression mais seulement avec sa recherche dans les automates de recherche traditionnels. Il a failli dans sa prétention dans la recherche des manchettes. Copernic n'est pas en mesure de repérer et d'éliminer les pages qui ont des différences mineures. C'est le cas des fils de presse repris par plusieurs journaux. Un autre cas est soulevé par Google News et AlltheWeb qui ajoutent le temps d'affichage dans ses références. Les articles reçoivent un temps d'affichage modifié tout au long de la journée avec la mention «4 hours ago», «6 hours ago», etc. Dans le résultat de recherche, Copernic trouve le même article et l'affiche en double ou en triple alors qu'il est unique dans Google News. Copernic semble ajouter des références qu'il juge nouvelles à sa liste au lieu de refaire une nouvelle liste d'où la duplication. 4. Déficience dans l'affinage du résultatCopernic a «amélioré» l'affinage du résultat. L'analyse comprend 3 niveaux: minimale (vérifie et élimine les liens identiques), intermédiaire (vérifie et élimine les liens identiques ou invalides, repère les tailles et les dates de modifications des pages web) et optimale (vérifie et élimine les liens identiques ou invalides, repère les tailles et les dates de modifications des pages web, détecte les langues des pages et les pages identiques). L'analyse optimale comprend aussi trois fonctions: «conserver seulement les résultats contenant les mots clés, extraire les concepts clés des pages web et sauvegarder les pages sur disque pour consultation hors ligne». Parmi ces fonctions, seule celle de conserver les résultats contenant les «mots clés» est inadéquate. Le résultat de cette opération bloque la consultation des références éliminées. Ces références-ci aident le chercheur à affiner sa stratégie. Pour l'affinage du résultat, il ne doit pas utiliser cette fonction et faire son affinage a posteriori. Heureusement, Copernic a ajouté la recherche dans le résultat. Malheureusement, il n'exploite pas la recherche dans les concepts qui ne contiennent pas toujours les mots de la requête. Il ne fait pas non plus de recherche par champs. 5. Interface encombréeL'interface comprend trois barres d'outils, une barre de commandes et trois sections. Lorsque toutes les barres sont affichées, l'interface devient encombrée. Les fenêtres peuvent être dimensionnées mais elles n'ont pas de fermeture automatique. Il faut ouvrir la fonction d'affichage pour activer une fenêtre.Pour enlever cette impression d'encombrement, les barres d'outils sont amovibles et flottantes avec la souris. Il n'en demeure pas moins que l'écran est surchargé et peu maniable. 6. Restriction des pages à surveiller
La surveillance automatisée des pages est appelée «veille
de page». Cette fonction est une innovation pour Copernic.
Cependant, elle est restreinte aux pages statiques. Pendant un mois,
plusieurs pages ont été mises sous surveillance. Parmi
celles-ci, trois d'entre elles étaient des requêtes dans Yahoo!,
HotBot et Google. La surveillance des requêtes est un excellent
moyen pour voir la dynamique des références et leurs environnements.
Les pages de Yahoo! et de HotBot ont été très bien rendues
contrairement à Google. Copernic n'a pas réussi ce test
ni celui de la surveillance de la page d'accueil de Branchez-vous! 7. Déficience dans l'envoi des rapports
Le test d'envoi des rapports a été mené avec Netscape
7. Copernic a ajouté l'envoi des rapports en fichier joint à
son envoi dans le corps du message. Cette initiative est particulièrement
appréciée. Cependant, elle aurait besoin d'être
peaufinée avec deux améliorations. La première
est le nom des fichiers, la seconde est l'option d'envoi. 8. Intégration à Internet ExplorerCopernic est déjà intégré à Internet Explorer. Avec la version 6, de nouvelles caractéristiques apparaissent: surveillance de page, historique, raccourci pour remonter de niveau dans un site en plus du surlignage, de la fenêtre de recherche et des flèches de navigation dans la page et dans le résultat de recherche. La barre d'outils de Copernic est utile, mais elle n'est pas gigogne, c'est son principal défaut. S'il y a un manque d'espace, des fonctions disparaissent. Il faut la mettre pleine largeur pour les avoir toutes. C'est pourquoi, la barre d'outils de Copernic cohabite mal avec d'autres barres comme celles de Yahoo! ou de Google. Il aurait été plus sage que cette barre soit intégrée au volet de recherche. 9. Inadéquation des résultats de recherche
Une comparaison a été faite entre les réponses du résultat
de recherche de quelques sites web et ceux de Copernic. Cette comparaison
a donné des différences. Nous savons que les sites nationaux
sont adaptés au pays. Copernic ne semble pas y être sensible
et on y trouve des incohérences. Les forces de Copernic Agent professionalCopernic Agent Professional a 6 forces: surveillance automatique de changements dans des pages web, création de résumés des pages Web trouvées, possibilité de créer des catégories personnelles, recherche dans le résultat, création de sous-dossiers, envoi des rapports de recherche par fichier joint. 1. Surveillance automatique de changements dans des pages WebLa surveillance automatique de changements dans des pages web est une réussite «imparfaite», une réussite tout de même. Elle est efficace pour les pages statiques qui sont majoritaires. Les changements sont surlignés et la majorité des sauvegardes des pages sont conformes aux originales. 2. Création de résumés des pages Web trouvéesCopernic a intégré dans son CAP son Summarizer. Cette intégration se révèle un succès avec l'ajout des concepts dans les références. Elle permet de mieux les apprécier. 3. Possibilité de créer des catégories personnellesLa création de catégories personnelles de sites de recherche n'est pas à dédaigner. Il est possible de regrouper dans une catégorie plusieurs domaines et même plusieurs sites de recherche. La souplesse de cette fonction est remarquable. L'ajout de sites de recherche extérieurs à Copernic lui donnerait une grande flexibilité. 4. Recherche dans le résultatEn comparaison avec la version précédente, la recherche dans le résultat est une bonne amélioration bien que ce ne soit pas suffisant. Le formulaire de recherche avancé demeure fruste. En fait d'avancé, il est plutôt de base en regard des formulaires d'un AltaVista et d'un HotBot. Toutefois, il constitue un tremplin pour une version 7. L'effort est louable et digne de mention. 5. Création de sous-dossiersLa création de sous-dossiers est ce petit quelque chose qui plaît. Rien de révolutionnaire, elle est tout à fait pratique. 6. Envoi des rapports de recherche par fichier joint
Copernic 2001 avait déjà l'envoi des rapports par courriel
dans le corps du message. La version 6 ajoute le fichier joint.
La recherche envoyée de cette façon garde les caractéristiques
de l'original notamment pour le tri. En ajoutant le tri par titre,
il est facile de repérer les pages identiques passées au travers
des mailles du filtre. 7. L'annotation des références Il
arrive à l'occasion de mettre une note sur une référence.
Copernic a très bien intégré cette fonction. Celle-ci
se trouve dans la fenêtre des paramètres de la référence.
La note créée se place sur le côté gauche
de la référence sous la forme d'un «post-it» jaune. Conclusion
Au cours des années, Copernic a choisi le chemin du développement
horizontal. Il a augmenté le nombre de ses sites de recherche
et il les a regroupés. Il a intégré son logiciel
Summarizer lui donnant une plus-value. Il a ajouté la surveillance
de pages web et l'envoi de fichiers joints. Il a amélioré
sa recherche interne avec l'ajout d'un formulaire. Toutes ces améliorations
nous ont fait oublier qu'il a perdu son traducteur. |
Service
de recherche documentaire DSI. 1280-4, boulevard de Montarville. Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: marcduval@dsi-info.ca |
©2002. Marc Duval. |
Mots clés : Bibliothèques (vedettes matières) : recherche
sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages
de références ; gestion de l'information / Nomade : recherche
sur le Web / ODP : recherche sur le Net / Toile du Québec : gestion
de l'information ; Internet - Guides ; guides perfectionnement à
la recherche / Voila : internet - recherche d'info sur le web / Yahoo : recherche
sur le Net ; recherche sur le Web ; recherche et traitement de l'information
; internet - information et documentation / Pages jaunes : renseignements-service
Longueuil ; Identificateurs : Évaluation ; Copernic Agent Professional
; Histoire; méta-moteur ; méta-chercheur |