DSI. Le carnet des sites de recherche
par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec
Index abrégé du site de DSI :
Les actualités des sites de recherche
Les fiches techniques: AlltheWeb,
AltaVista,
AntiSearch,
Google,
HotBot,
MSN Search,
Northern Light,
Voila - Tout le web francophone
/ Chronique de la recherche
/ Classement des automates de recherche
/ Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine
| Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche
|
[Archives] / [Atom] / [RSS]
2003-03-05
Le web
sémantique... pour bientôt?
Depuis quelque temps, le web sémantique sort timidement des officines. L'article Perdu et retrouvé du The Sydney Morning Herald m'a fait découvrir un autre aspect: la LSI (Latent Semantic Indexing). Voici un extrait du document Filtrage de l'information qui le définit:
«La méthode nécessite une étude de tout le texte pour en extraire des relations utiles entre les termes et les documents. Des techniques statistiques sont utilisées pour calculer et simuler ces associations. Le principe de la méthode consiste à construire une matrice (termes-documents), ensuite est réduite en lui appliquant
la méthode de décomposition SVD (approximation par combinaisons linéaires).»
L'auteur termine: «Ainsi, la conclusion générale que l'on peut évoquer est que les méthodes les plus récentes (traitement du langage naturel, LSI et réseaux neuronaux) semblent prometteuses.»
Le texte date de 1997. Le temps n'est peut-être pas si loin où une méthode sera appliquée au web.
posté par Marc Duval, #référence - 20:37
Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un
ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.