1 laboratoire informatique & systématique bases de connaissances et systématique. pour une...

Post on 03-Apr-2015

109 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

Laboratoire Informatique

& Systématique

Bases de connaissances et systématique.

Pour une systématique assistée par ordinateur

Bruno MERIGUET Version Octobre 2009

2

Bases de connaissances et systématique.

Introduction :Données & connaissances,bases de données & bases de connaissances

Seconde partie : la réalisation d’une base de connaissances réalisation théorie)

Troisième partie : exploitation d’une base de connaissances

3

Elles contiennent les éléments suivants : Nomenclature,Illustrations,Références bibliographiques, DescriptionsDiagnoses : descriptions différentielles, Clés d’identification.

Monographies, faune et flores

Elles sont le résultat du travail d’experts.

Les révisions, les nouvelles descriptions sont les seules alternatives pour maintenir à jour nos connaissances.

un important travail de bibliographie pour rester à jour.

4

Les éléments constitutifs se répartissent en 2 catégories : Nomenclature. Illustrations. Références bibliographiques. Descriptions. Diagnoses : descriptions diagnostiques. Clés d’identification.

Typologie des informations

Données

5

Données Concernent des faits uniques  N’expriment que ce que l’on a observé.Peuvent être mises en œuvre avec les Systèmes de Gestion de Bases de Données actuels.

Les éléments de nomenclature, les illustrations et les références bibliographiques sont des données, facile à conserver dans une Base de Données.

Les bases de données et SGBD sont largement développés et utilisées (bibliographie, adhérents, commandes, …) Exemples : Access , Oracle, Openbase, etc....

6

Les éléments constitutifs se répartissent en 2 catégories : Nomenclature. Illustrations. Références bibliographiques. Descriptions. Diagnoses : descriptions diagnostiques. Clés d’identification.

Typologie des informations

Données

Connaissances

7

Connaissances Concernent des faits généraux : Se basent sur ce que l’on a observé mais n’expriment pas seulement ce que l’on a vu. Ne peuvent pas être mises en œuvre de manière réaliste avec les Systèmes de Gestion de Bases de Données actuels.

Les descriptions, diagnoses, et clés d’identification sont des connaissances.

8

Résumé: La systématique utilise des données et des connaissances.

Deux outils différents sont nécessaires pour manipuler ces données

Les bases de connaissance sont dédiée à la gestion des connaissances.

9

Systèmes de Gestion de Bases de Connaissances.

Les systèmes de gestion de bases de connaissances sont des logiciels qui répondent aux besoins de représentation, de gestion.

Ils permettent le traitement des connaissances produites par la systématique en fonction des besoins des utilisateurs .

Ils sont peu nombreux. Ils restent d’un usage encore confidentiel.

10

Réalisation d’une base de connaissance :

la représentationSystème descriptif (description-type, ce qui existe en soi). Ce par quoi on décrit (les descripteurs, leurs types et leurs relations).

Système conceptuel (classification). C’est ce que l’on va décrire (les taxons et leurs relations).

Descriptions. Croisement des deux systèmes.

11

Le système descriptif .

12

Le système descriptif .

Les éléments servant à décrire

13

Le système conceptuel .

Ce qui est décrit : les espèces , les familles ,…..

14

La description.

15

La description.

16

La gestion des connaissances.

Tester la cohérence des connaissances contenue dans une base.

Des fonctions permettent de vérifie le contenu d'une base de connaissances

- Détection des données manquantes et vérification des relations logiques entre variables.

- Comparaison de toutes les descriptions de la base entre elles et appréciation de leur pouvoir de discrimination.

17

La gestion des connaissances.

18

La gestion des connaissances.

19

La gestion des connaissances.

20

Exploitation d’une base de connaissance.

Descriptions synthétique

Description en langage naturel

Diagnoses : descriptions diagnostiques

Réalisation de clés d’identification papier

Traitements possible d’une base de connaissance.

21

Description brutePerlamantis aliberti m

variable 1 Présence d'ailes : individu ailé

variable 2 couleur des élytres : bruns ou gris

variable 3 longueur relative des ailes : Ailes au moins aussi longue que l'abdomen

variable 4 Coloration des ailes postérieures : uniformes

variable 5 Nombre d'épines discoidales : 1

variable 6 Epines du tibias : tibias inerme

variable 7 épines internes du fémur : 3

variable 8 Extension du vertex : sans extension

variable 9 Pronotum : rapport longueur/largeur : a peine plus long que large

variable 10 Pronotum : position de la dilatation : non dilaté

variable 11 plaque suranale : proportions : plus longue que large ou plus large que longue ou aussi large que longue

22

Description en langage naturel

Perlamantis aliberti m

Tête :

yeux arrondis, antennes filiformes, vertex sans extension, écusson frontal plus large que haut, plan, sans ornementations, occiput présente un tubercule post occulaire.

Ailes:

individu ailé, Ailes au moins aussi longue que l'abdomen. Elytres bruns ou grises. Ailes postérieures uniformes.

Pattes antérieures :

Hanches concolores. Fémur avec 1 épine discoidale, épines internes au nombre de 3. tibias inerme, épine terminale aplatie.

23

Diagnose : description différentielle

3 - Iris oratoria m

Pronotum : position de la dilatation située vers le tiers antérieur

prozone : bordure lisse

épines géniculaires présentes

4 - Iris oratoria f

longueur du corps 28-34 mm ou 35-46 mm ou 47-53 mm

longueur relative des ailes Ailes ne dépassant pas l'abdomen

5 - perlamantis aliberti m

longueur du corps 14-16,5 mm

Sexe Male.

24

Réalisation de clés d’identification papier

17:1 Ecusson : forme = plan (avec ou sans ornementations)

==> 18

17:2 Ecusson : forme = pyramidal (volumineux)

==> 23

18:1 Pronotum : position de la dilatation = située vers le tiers antérieur

==> 19

18:2 Pronotum : position de la dilatation = située vers le milieu

==> 20

19:1 plaque suranale : forme = angulaire

==> Mantis religiosa f

19:2 plaque suranale : forme = arrondie

==> Iris oratoria f

25

Réalisation de phylogénies

Utilisations possible d’une base de connaissance.

Publication et mise à jour de monographies, faunes et flore

Identification assistée par ordinateur (IAO).

26

Intérêt d ’une base de connaissance

Avec les bases de connaissances, seul le travail de synthèse des descriptions est nécessaire.

En cas de modifications de la base de connaissances, le travail déjà réalisé n’est pas à refaire.

Le base de connaissances représente la source de toutes les autres productions.

Informatisation des descriptions taxinomiques = réalisation d’une base de connaissances.

27

Identification

28

Conditions d’une identification correcte.

Il faut que la liste des taxons décrits dans la base de connaissances soit exhaustive.

Il faut que les descriptions des taxons couvrent toute la variabilité des taxons.

Il faut que le spécimen décrit appartienne à l’ensemble des taxons décrits.

Il faut que la description du spécimen à identifier ne soit pas erronée (identificateur).

29

L ’Identification Assistée par Ordinateur, une approche

différente de la détermination.

Un exemple :

30

La méthode :

L’identificateur sélectionne un caractère dans la liste des caractères disponibles.

Il compare les modalités proposées avec le spécimen à identifier et valide celle qui correspond au mieux (ou change de caractère).

la liste des taxons et la liste des caractères est instantanément mise à jour.

L’identificateur peut choisir un nouveau caractère, jusqu’à n’avoir plus qu’une seule espèce.

cette espèce est celle qui correspond aux mieux au spécimen étudié.

31

32

33

34

35

36

37

38

Intérêt de l ’identification assistée par ordinateur

L’IAO laisse un accès libre aux descripteurs.

Plus facile à utiliser pour un débutant.Plus rapide pour l’expert.

Permet l’identification de spécimens incomplets.

L’IAO n’aboutit pas nécessairement à une identification.

Les clés papier aboutissent à une identification, même en cas d’erreurs.

39

Les bases de connaissance en entomologie

40

Les systèmes

Plusieurs systèmes co-existent

Des utilitaires permettent de porter une base de connaissance d’un format vers un autre par exemple entre Delta et xper.

MEKA Multiple-Entry Key Algorithm Christopher A. MEACHAM

LINNAEUS II, ETI, the Expert Center for Taxonomic Identification,

DELTA, DEscription Language for Taxonomy, M. J. Dallwitz XPER2,

41

État du développement d ’XPER2

Xper 2 est un système modulaire sur lequel il reste plusieurs modules à intégrer au cours d ’un travail de programmation.

Xper2 et ses utilitaires sont actuellement développés par le laboratoire Informatique et systématique de l ’université Pierre et Marie Curie (paris VI).

top related