1 laboratoire informatique & systématique bases de connaissances et systématique. pour une...

41
1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur uno MERIGUET Version Octobre 2009

Upload: thierri-paquet

Post on 03-Apr-2015

109 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

1

Laboratoire Informatique

& Systématique

Bases de connaissances et systématique.

Pour une systématique assistée par ordinateur

Bruno MERIGUET Version Octobre 2009

Page 2: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

2

Bases de connaissances et systématique.

Introduction :Données & connaissances,bases de données & bases de connaissances

Seconde partie : la réalisation d’une base de connaissances réalisation théorie)

Troisième partie : exploitation d’une base de connaissances

Page 3: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

3

Elles contiennent les éléments suivants : Nomenclature,Illustrations,Références bibliographiques, DescriptionsDiagnoses : descriptions différentielles, Clés d’identification.

Monographies, faune et flores

Elles sont le résultat du travail d’experts.

Les révisions, les nouvelles descriptions sont les seules alternatives pour maintenir à jour nos connaissances.

un important travail de bibliographie pour rester à jour.

Page 4: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

4

Les éléments constitutifs se répartissent en 2 catégories : Nomenclature. Illustrations. Références bibliographiques. Descriptions. Diagnoses : descriptions diagnostiques. Clés d’identification.

Typologie des informations

Données

Page 5: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

5

Données Concernent des faits uniques  N’expriment que ce que l’on a observé.Peuvent être mises en œuvre avec les Systèmes de Gestion de Bases de Données actuels.

Les éléments de nomenclature, les illustrations et les références bibliographiques sont des données, facile à conserver dans une Base de Données.

Les bases de données et SGBD sont largement développés et utilisées (bibliographie, adhérents, commandes, …) Exemples : Access , Oracle, Openbase, etc....

Page 6: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

6

Les éléments constitutifs se répartissent en 2 catégories : Nomenclature. Illustrations. Références bibliographiques. Descriptions. Diagnoses : descriptions diagnostiques. Clés d’identification.

Typologie des informations

Données

Connaissances

Page 7: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

7

Connaissances Concernent des faits généraux : Se basent sur ce que l’on a observé mais n’expriment pas seulement ce que l’on a vu. Ne peuvent pas être mises en œuvre de manière réaliste avec les Systèmes de Gestion de Bases de Données actuels.

Les descriptions, diagnoses, et clés d’identification sont des connaissances.

Page 8: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

8

Résumé: La systématique utilise des données et des connaissances.

Deux outils différents sont nécessaires pour manipuler ces données

Les bases de connaissance sont dédiée à la gestion des connaissances.

Page 9: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

9

Systèmes de Gestion de Bases de Connaissances.

Les systèmes de gestion de bases de connaissances sont des logiciels qui répondent aux besoins de représentation, de gestion.

Ils permettent le traitement des connaissances produites par la systématique en fonction des besoins des utilisateurs .

Ils sont peu nombreux. Ils restent d’un usage encore confidentiel.

Page 10: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

10

Réalisation d’une base de connaissance :

la représentationSystème descriptif (description-type, ce qui existe en soi). Ce par quoi on décrit (les descripteurs, leurs types et leurs relations).

Système conceptuel (classification). C’est ce que l’on va décrire (les taxons et leurs relations).

Descriptions. Croisement des deux systèmes.

Page 11: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

11

Le système descriptif .

Page 12: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

12

Le système descriptif .

Les éléments servant à décrire

Page 13: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

13

Le système conceptuel .

Ce qui est décrit : les espèces , les familles ,…..

Page 14: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

14

La description.

Page 15: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

15

La description.

Page 16: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

16

La gestion des connaissances.

Tester la cohérence des connaissances contenue dans une base.

Des fonctions permettent de vérifie le contenu d'une base de connaissances

- Détection des données manquantes et vérification des relations logiques entre variables.

- Comparaison de toutes les descriptions de la base entre elles et appréciation de leur pouvoir de discrimination.

Page 17: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

17

La gestion des connaissances.

Page 18: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

18

La gestion des connaissances.

Page 19: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

19

La gestion des connaissances.

Page 20: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

20

Exploitation d’une base de connaissance.

Descriptions synthétique

Description en langage naturel

Diagnoses : descriptions diagnostiques

Réalisation de clés d’identification papier

Traitements possible d’une base de connaissance.

Page 21: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

21

Description brutePerlamantis aliberti m

variable 1 Présence d'ailes : individu ailé

variable 2 couleur des élytres : bruns ou gris

variable 3 longueur relative des ailes : Ailes au moins aussi longue que l'abdomen

variable 4 Coloration des ailes postérieures : uniformes

variable 5 Nombre d'épines discoidales : 1

variable 6 Epines du tibias : tibias inerme

variable 7 épines internes du fémur : 3

variable 8 Extension du vertex : sans extension

variable 9 Pronotum : rapport longueur/largeur : a peine plus long que large

variable 10 Pronotum : position de la dilatation : non dilaté

variable 11 plaque suranale : proportions : plus longue que large ou plus large que longue ou aussi large que longue

Page 22: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

22

Description en langage naturel

Perlamantis aliberti m

Tête :

yeux arrondis, antennes filiformes, vertex sans extension, écusson frontal plus large que haut, plan, sans ornementations, occiput présente un tubercule post occulaire.

Ailes:

individu ailé, Ailes au moins aussi longue que l'abdomen. Elytres bruns ou grises. Ailes postérieures uniformes.

Pattes antérieures :

Hanches concolores. Fémur avec 1 épine discoidale, épines internes au nombre de 3. tibias inerme, épine terminale aplatie.

Page 23: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

23

Diagnose : description différentielle

3 - Iris oratoria m

Pronotum : position de la dilatation située vers le tiers antérieur

prozone : bordure lisse

épines géniculaires présentes

4 - Iris oratoria f

longueur du corps 28-34 mm ou 35-46 mm ou 47-53 mm

longueur relative des ailes Ailes ne dépassant pas l'abdomen

5 - perlamantis aliberti m

longueur du corps 14-16,5 mm

Sexe Male.

Page 24: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

24

Réalisation de clés d’identification papier

17:1 Ecusson : forme = plan (avec ou sans ornementations)

==> 18

17:2 Ecusson : forme = pyramidal (volumineux)

==> 23

18:1 Pronotum : position de la dilatation = située vers le tiers antérieur

==> 19

18:2 Pronotum : position de la dilatation = située vers le milieu

==> 20

19:1 plaque suranale : forme = angulaire

==> Mantis religiosa f

19:2 plaque suranale : forme = arrondie

==> Iris oratoria f

Page 25: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

25

Réalisation de phylogénies

Utilisations possible d’une base de connaissance.

Publication et mise à jour de monographies, faunes et flore

Identification assistée par ordinateur (IAO).

Page 26: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

26

Intérêt d ’une base de connaissance

Avec les bases de connaissances, seul le travail de synthèse des descriptions est nécessaire.

En cas de modifications de la base de connaissances, le travail déjà réalisé n’est pas à refaire.

Le base de connaissances représente la source de toutes les autres productions.

Informatisation des descriptions taxinomiques = réalisation d’une base de connaissances.

Page 27: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

27

Identification

Page 28: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

28

Conditions d’une identification correcte.

Il faut que la liste des taxons décrits dans la base de connaissances soit exhaustive.

Il faut que les descriptions des taxons couvrent toute la variabilité des taxons.

Il faut que le spécimen décrit appartienne à l’ensemble des taxons décrits.

Il faut que la description du spécimen à identifier ne soit pas erronée (identificateur).

Page 29: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

29

L ’Identification Assistée par Ordinateur, une approche

différente de la détermination.

Un exemple :

Page 30: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

30

La méthode :

L’identificateur sélectionne un caractère dans la liste des caractères disponibles.

Il compare les modalités proposées avec le spécimen à identifier et valide celle qui correspond au mieux (ou change de caractère).

la liste des taxons et la liste des caractères est instantanément mise à jour.

L’identificateur peut choisir un nouveau caractère, jusqu’à n’avoir plus qu’une seule espèce.

cette espèce est celle qui correspond aux mieux au spécimen étudié.

Page 31: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

31

Page 32: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

32

Page 33: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

33

Page 34: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

34

Page 35: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

35

Page 36: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

36

Page 37: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

37

Page 38: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

38

Intérêt de l ’identification assistée par ordinateur

L’IAO laisse un accès libre aux descripteurs.

Plus facile à utiliser pour un débutant.Plus rapide pour l’expert.

Permet l’identification de spécimens incomplets.

L’IAO n’aboutit pas nécessairement à une identification.

Les clés papier aboutissent à une identification, même en cas d’erreurs.

Page 39: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

39

Les bases de connaissance en entomologie

Page 40: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

40

Les systèmes

Plusieurs systèmes co-existent

Des utilitaires permettent de porter une base de connaissance d’un format vers un autre par exemple entre Delta et xper.

MEKA Multiple-Entry Key Algorithm Christopher A. MEACHAM

LINNAEUS II, ETI, the Expert Center for Taxonomic Identification,

DELTA, DEscription Language for Taxonomy, M. J. Dallwitz XPER2,

Page 41: 1 Laboratoire Informatique & Systématique Bases de connaissances et systématique. Pour une systématique assistée par ordinateur Bruno MERIGUETVersion Octobre

41

État du développement d ’XPER2

Xper 2 est un système modulaire sur lequel il reste plusieurs modules à intégrer au cours d ’un travail de programmation.

Xper2 et ses utilitaires sont actuellement développés par le laboratoire Informatique et systématique de l ’université Pierre et Marie Curie (paris VI).