le traitement automatique de la parole 1 reconnaissance de la parole ivan magrin-chagnolleau, cnrs...

32
LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage [email protected]

Upload: fernand-blondel

Post on 03-Apr-2015

136 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1

Reconnaissance de la parole

Ivan Magrin-Chagnolleau, CNRSLaboratoire Dynamique Du Langage

[email protected]

Page 2: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 2

Objectifs

Transformer un signal de parole en :

• Texte (dictée vocale, transcription)

• Action (commande vocale, systèmes de dialogue)

• Information indexée (annotation, indexation)

Page 3: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 3

Les sources de variabilité• Les facteurs intra-locuteurs :

co-articulation, variation dans la prononciation, etc.

• Les facteurs inter-locuteurs :physiologie, age, sexe, psychologie, familiarité avec l’application, etc.

• L’environnement :bruit, micro, canal de transmission, présence d’autres locuteurs, etc.

Page 4: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 4

Variabilité intra- et inter-locuteur

Page 5: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 5

Variabilité intra-locuteur

Page 6: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 6

Typologie des systèmes

• Type de parole

• Taille du vocabulaire

• Niveau de dépendance par rapport aux locuteurs

• Environnement d’utilisation

• Profil des utilisateurs potentiels

Page 7: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 7

Type de parole

• Mots isolés

• Mots connectés

• Détection de mots clés

• Parole contrainte

• Parole continue

• Parole spontanée

Page 8: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 8

Taille du vocabulaire

• Quelques mots (5 – 50)

• Petit vocabulaire (50 – 500)

• Vocabulaire moyen (500 – 5000)

• Grand vocabulaire (5000 – 50000)

• Très grand vocabulaire (> 50000)

Page 9: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 9

Dépendance au locuteur

• Dépendant du locuteur :le système fonctionne correctement avec un utilisateur particulier

Adaptation au locuteur =utilise quelques données spécifiquesd’un locuteur pour adapter le système

à une nouvelle voix

• Indépendant du locuteur :le système fonctionne avec n’importe quel utilisateur

Page 10: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 10

Environnement d’utilisation

• Parole large-bande(ordinateur, etc.)

• Parole bande-étroite avec distorsion (téléphone, etc.)

• Environnement calme (bureau + micro-casque)

• Bruit de fond

Page 11: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 11

Profil des utilisateurs potentiels

• Utilisation professionnelle par des spécialistes

• Grand public

• Entraîné / naïf

• Fréquent / occasionnel

• Utilité

• Coopération

Page 12: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 12

Deux exemples

Dictée vocale• Parole continue

• Grand vocabulaire• Adaptation au locuteur

• Bureau+micro-casque• Utilisateurs

d’ordinateurs

Service téléphonique• Détection de mots

clés• Quelques mots• Indépendant du

locuteur• Parole téléphonique• Grand public

Page 13: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 13

Système de reconnaissance de mots

Page 14: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 14

Programmation dynamique (DTW)

meilleurchemin

),()Y,X( 2jid yx

Mot inconnu Y

Mot

X

Mot 1

Mot 2

Mot n

Page 15: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 15

Contraintes locales

Page 16: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 16

Contraintes locales : exemple

Page 17: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 17

Modèle de Markov caché : principe

Page 18: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 18

Modèles de Markov cachés (HMM)

meilleurchemin

)S(Plog)Y,X(iXjy

Mot 2

Mot 1

Mot n

Mot inconnu Y

Mot

X

Page 19: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 19

Viterbi : exemple

Page 20: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 20

Algorithme de Viterbi : exercice

Page 21: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 21

Le modèle hiérarchique

Page 22: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 22

Le modèle hiérarchique : exemple

Page 23: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 23

Modèles phonétiques (1)

Page 24: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 24

Modèles phonétiques (2)

Le mot « américain »

Page 25: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 25

Modèles contextuels

Page 26: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 26

Modèles de langage• A un instant donné, tous les mots n’ont

pas la même probabilité de présence :– Le petit chat boit du …

• Grammaires probabilistes : toutes les phrases sont possibles mais avec des probabilités différentes

• Grammaires à états finis : partition binaire des séquences de mots en « séquences possibles » et « séquences impossibles »

Page 27: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 27

Modèle acoustique + Modèle de langage

Page 28: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 28

Les n meilleures phrases

Page 29: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 29

Treillis de mots / Graphe de mots

Page 30: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 30

Graphe de mots (2)

Page 31: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 31

Performances

Page 32: LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 1 Reconnaissance de la parole Ivan Magrin-Chagnolleau, CNRS Laboratoire Dynamique Du Langage ivan@ieee.org

LE TRAITEMENT AUTOMATIQUE DE LA PAROLE 32

Recherche actuelle