ue303.c : cours n°5 conception de système d’information multimédia
DESCRIPTION
UE303.c : cours n°5 Conception de système d’information multimédia. Catalogues électroniques multimédias : performances. Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche SITE – LORIA [email protected]. Promo. Master IST-IE 05/06. I. Catalogage électronique. Processus. - PowerPoint PPT PresentationTRANSCRIPT
UE303.c : cours n°5
Conception de système d’information multimédia Promo. Master IST-IE 05/06
Par :
Sahbi SIDHOMMCF. Université Nancy 2
Equipe de recherche SITE – [email protected]
Catalogues électroniques multimédias : performances
2
I.Catalogage électronique
Processus
3
Principe
Les catalogues sont des listes de tous les documents conservés dans une unité d’information et présentés selon un ordre spécifique :– par auteur– par matière– par nom de lieu– par titre
4
Fonction
Un catalogue indique l’endroit où se trouve les documents cités, ce que ne fait pas généralement une bibliographie
Tout document entrant dans une unité d’information doit être inscrit à son catalogue
5
Procédés
Les catalogues peuvent se présenter selon trois (03) procédés :
1. Alphabétique (qui est le plus simple)
2. Systématique (ou méthodique), selon un plan de classement
3. Topographique, selon l’ordre du numéro d’identification des documents d’après lequel ils sont rangés physiquement dans les magasins
6
Présentation
Les fiches d’un catalogue peuvent être réunies en volumes imprimés qui ont l’avantage de pouvoir être distribués dans diverses unités d’information et auprès des utilisateurs pour faciliter les recherches
Avec l’automatisation (de bibliothèques, de centre Doc., de SI des entreprises), les catalogues sont (souvent) produits à partir d’une base de données lisible par ordinateur pour :– Créer des fiches– Produire des listes– Interroger et faire des recherches d’information
7
Catalogues collectifs
Les Ccoll. ressemblent dans une même liste les catalogues de plusieurs bibliothèques ou institutions.
Exemple aux USA :
Il existe des catalogues collectifs de livres, par exemple : the national union catalog (NUC), liste cumulative des fiches de la Library of Congress avec d’autres bibliothèques des USA (qui depuis 1983 est accessible en ligne)
Exemple en France :
en 1997, la BnF a créé sa bibliothèque numérique « gallica » avec 76 000 imprimés numérisés en mode image, 15 000 documents en mode texte, 30 000 images et 30H de son. (2 millions de lecteurs en 2004).
8
Catalogues commerciaux
Les Ccom. sont des listes de produits fabriqués ou distribués par une entreprise ou un groupe d’entreprises.
Ils donnent souvent une brève description des produits et leurs références. Il permettent de connaître la gamme des produits disponibles et de passer des commandes directement.
Exemple eBay :
Fondé en septembre 1995, eBay (Nasdaq : EBAY) constitue la plus grande communauté d'achat et de vente de biens et de services en ligne. qui dit « biens et services » en IE…
9
Autres catalogues
Catalogue de bibliothèque Catalogue de publications en série Catalogue d’éditeur …
10
Catalogue multimédia
L’orientation vers le multimédia permet de rajouter un nouveau ordre spécifique dans les catalogues : Types de document
Accès au document intégral (full document) : accès aux contenus des notices bibliographiques accès aux résumés accès aux annotations
>> si présence d’un thésaurus : accès aux termes, thèmes et descripteurs
11
II.Catalogage électronique
Recherche d’information
Évolutions
12
Procédure de recherche sur un catalogue en ligne
Besoin(s) informationnel(s) Traduction du besoin en un problème de recherche
d’information Formulation de la recherche :
– Équations de recherche (attributs, valeurs)– Termes proposés : thésaurus en ligne– Termes libres : utilisateur, veilleur– Opérateurs
Extraction Résultats intermédiaires et reformulations validation
13
Mesures d’efficacité d’un SRI
L’évaluation des SRI consiste à mesurer divers paramètres qui expriment la plus ou moins grande capacité d’un système de retrouver les documents ou leurs références répondant aux questions posées
Le but de l’évaluation est de connaître l’efficacité du système :– La réponse est-elle aussi complète, exhaustive et pertinente
que possible ?– À quelles conditions peut-on diminuer le coût et augmenter
l’efficacité d’un tel système ?– Quels sont les avantages ?
à préciser comment un tel système fonctionne ou à déterminer pourquoi il fonctionne à un tel niveau (limites)
14
Principaux paramètres
D
C (silence)
A (réponse correcte reçue)
B (bruit)
D
Documentsnon pertinents
Documentspertinents
Documentsnon pertinents
Documentsretrouvés
Corpus
de
documents
15
Rappel et Précision
Le taux de rappel (ou d’exhaustivité) est la proportion de documents pertinents retrouvés par rapport à l’ensemble des documents pertinents présents dans la base
Le taux de précision ou de pertinence est la proportion de documents pertinents par rapport à l’ensemble des documents fournis par la recherche
16
Exemple
Si une base de données de 100 références (documents) avec 20 qui répondent à la question ; le système en retrouve 15, mais omet les 5 autres :
Le taux de « rappel » est de 15/20 (75%) Les documents pertinents qui n’ont pas été retrouvés
constituent ce que l’on appelle le « silence », 5/20 (25%)
Si une recherche donne 40 références en réponse à la question avec 15 documents pertinents,
Le taux de « précision » est de 15/40 (37,5%) On appelle « bruit » les 25 documents non pertinents qui ont été
fournis en même temps, 25/40 (62,5%)
17
Courbe de performance
60%
30%
30% 70%
Précision
Rappel
18
III.Facteurs calculables
SRI et catalogues
19
Facteurs de mesure
Rappel Précision Bruit Silence
20
Taux de précision (P)
21
Taux de rappel
22
Bruit
23
Silence
24
Comment mesurer ?
A
CD
B pertinence
extraction
e
e
pp
Méthode :
1. Définition
2. Visualisation
3. Équation
25
Synthèse des valeurs
Rappel = A / (A+C) Précision = A / (A+B) Bruit = B / (A+B) Silence = C / (A+C)
Application de la méthode :