ue303.c : cours n°5 conception de système d’information multimédia

Post on 14-Jan-2016

46 Views

Category:

Documents

20 Downloads

Preview:

Click to see full reader

DESCRIPTION

UE303.c : cours n°5 Conception de système d’information multimédia. Catalogues électroniques multimédias : performances. Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche SITE – LORIA sahbi.sidhom@loria.fr. Promo. Master IST-IE 05/06. I. Catalogage électronique. Processus. - PowerPoint PPT Presentation

TRANSCRIPT

UE303.c : cours n°5

Conception de système d’information multimédia Promo. Master IST-IE 05/06

Par :

Sahbi SIDHOMMCF. Université Nancy 2

Equipe de recherche SITE – LORIAsahbi.sidhom@loria.fr

Catalogues électroniques multimédias : performances

2

I.Catalogage électronique

Processus

3

Principe

Les catalogues sont des listes de tous les documents conservés dans une unité d’information et présentés selon un ordre spécifique :– par auteur– par matière– par nom de lieu– par titre

4

Fonction

Un catalogue indique l’endroit où se trouve les documents cités, ce que ne fait pas généralement une bibliographie

Tout document entrant dans une unité d’information doit être inscrit à son catalogue

5

Procédés

Les catalogues peuvent se présenter selon trois (03) procédés :

1. Alphabétique (qui est le plus simple)

2. Systématique (ou méthodique), selon un plan de classement

3. Topographique, selon l’ordre du numéro d’identification des documents d’après lequel ils sont rangés physiquement dans les magasins

6

Présentation

Les fiches d’un catalogue peuvent être réunies en volumes imprimés qui ont l’avantage de pouvoir être distribués dans diverses unités d’information et auprès des utilisateurs pour faciliter les recherches

Avec l’automatisation (de bibliothèques, de centre Doc., de SI des entreprises), les catalogues sont (souvent) produits à partir d’une base de données lisible par ordinateur pour :– Créer des fiches– Produire des listes– Interroger et faire des recherches d’information

7

Catalogues collectifs

Les Ccoll. ressemblent dans une même liste les catalogues de plusieurs bibliothèques ou institutions.

Exemple aux USA :

Il existe des catalogues collectifs de livres, par exemple : the national union catalog (NUC), liste cumulative des fiches de la Library of Congress avec d’autres bibliothèques des USA (qui depuis 1983 est accessible en ligne)

Exemple en France :

en 1997, la BnF a créé sa bibliothèque numérique « gallica » avec 76 000 imprimés numérisés en mode image, 15 000 documents en mode texte, 30 000 images et 30H de son. (2 millions de lecteurs en 2004).

8

Catalogues commerciaux

Les Ccom. sont des listes de produits fabriqués ou distribués par une entreprise ou un groupe d’entreprises.

Ils donnent souvent une brève description des produits et leurs références. Il permettent de connaître la gamme des produits disponibles et de passer des commandes directement.

Exemple eBay :

Fondé en septembre 1995, eBay (Nasdaq : EBAY) constitue la plus grande communauté d'achat et de vente de biens et de services en ligne. qui dit « biens et services » en IE…

9

Autres catalogues

Catalogue de bibliothèque Catalogue de publications en série Catalogue d’éditeur …

10

Catalogue multimédia

L’orientation vers le multimédia permet de rajouter un nouveau ordre spécifique dans les catalogues : Types de document

Accès au document intégral (full document) : accès aux contenus des notices bibliographiques accès aux résumés accès aux annotations

>> si présence d’un thésaurus : accès aux termes, thèmes et descripteurs

11

II.Catalogage électronique

Recherche d’information

Évolutions

12

Procédure de recherche sur un catalogue en ligne

Besoin(s) informationnel(s) Traduction du besoin en un problème de recherche

d’information Formulation de la recherche :

– Équations de recherche (attributs, valeurs)– Termes proposés : thésaurus en ligne– Termes libres : utilisateur, veilleur– Opérateurs

Extraction Résultats intermédiaires et reformulations validation

13

Mesures d’efficacité d’un SRI

L’évaluation des SRI consiste à mesurer divers paramètres qui expriment la plus ou moins grande capacité d’un système de retrouver les documents ou leurs références répondant aux questions posées

Le but de l’évaluation est de connaître l’efficacité du système :– La réponse est-elle aussi complète, exhaustive et pertinente

que possible ?– À quelles conditions peut-on diminuer le coût et augmenter

l’efficacité d’un tel système ?– Quels sont les avantages ?

à préciser comment un tel système fonctionne ou à déterminer pourquoi il fonctionne à un tel niveau (limites)

14

Principaux paramètres

D

C (silence)

A (réponse correcte reçue)

B (bruit)

D

Documentsnon pertinents

Documentspertinents

Documentsnon pertinents

Documentsretrouvés

Corpus

de

documents

15

Rappel et Précision

Le taux de rappel (ou d’exhaustivité) est la proportion de documents pertinents retrouvés par rapport à l’ensemble des documents pertinents présents dans la base

Le taux de précision ou de pertinence est la proportion de documents pertinents par rapport à l’ensemble des documents fournis par la recherche

16

Exemple

Si une base de données de 100 références (documents) avec 20 qui répondent à la question ; le système en retrouve 15, mais omet les 5 autres :

Le taux de « rappel » est de 15/20 (75%) Les documents pertinents qui n’ont pas été retrouvés

constituent ce que l’on appelle le « silence », 5/20 (25%)

Si une recherche donne 40 références en réponse à la question avec 15 documents pertinents,

Le taux de « précision » est de 15/40 (37,5%) On appelle « bruit » les 25 documents non pertinents qui ont été

fournis en même temps, 25/40 (62,5%)

17

Courbe de performance

60%

30%

30% 70%

Précision

Rappel

18

III.Facteurs calculables

SRI et catalogues

19

Facteurs de mesure

Rappel Précision Bruit Silence

20

Taux de précision (P)

21

Taux de rappel

22

Bruit

23

Silence

24

Comment mesurer ?

A

CD

B pertinence

extraction

e

e

pp

Méthode :

1. Définition

2. Visualisation

3. Équation

25

Synthèse des valeurs

Rappel = A / (A+C) Précision = A / (A+B) Bruit = B / (A+B) Silence = C / (A+C)

Application de la méthode :

top related