THALES COMMUNICATIONS
Projet RNRT SYMPATEX
16ème réunion d’avancement
E.N.S.T. Paris,
46, rue Barrault Paris 13 ème
10 décembre 200210 décembre 2002
Avancement SYMPATEX 2/5
Les
info
rmat
ions
con
tenu
es d
ans
ce d
ocum
ent
sont
la p
ropr
iété
exc
lusi
ve d
u G
roup
e T
HA
LES
. E
lles
ne d
oive
nt p
as ê
tre
divu
lgué
es s
ans
l'acc
ord
écrit
de
TH
ALE
S C
omm
unic
atio
ns.Agenda
• Accueil et introduction (15h00)
• Bilan des action en cours
• Traitement des fichiers d ’évaluation
• Codage de la prosodie
• Compression livres lus
• Autres sujets
• Présentation Ministère 10/12/2002
• Colloque RNRT Lille 27/01/2003, contributions poster
• Conclusions
Avancement SYMPATEX 3/5
Les
info
rmat
ions
con
tenu
es d
ans
ce d
ocum
ent
sont
la p
ropr
iété
exc
lusi
ve d
u G
roup
e T
HA
LES
. E
lles
ne d
oive
nt p
as ê
tre
divu
lgué
es s
ans
l'acc
ord
écrit
de
TH
ALE
S C
omm
unic
atio
ns.Bilan des actions en cours
(49) Structure de codage indépendant du locuteur
(53) Démonstrateur temps-réel (librairies et interface)
(55) Codage de la prosodie
(56) Compression de livres lus
(57,58) Optimisation de l’espace mémoire
Avancement SYMPATEX 4/5
Les
info
rmat
ions
con
tenu
es d
ans
ce d
ocum
ent
sont
la p
ropr
iété
exc
lusi
ve d
u G
roup
e T
HA
LES
. E
lles
ne d
oive
nt p
as ê
tre
divu
lgué
es s
ans
l'acc
ord
écrit
de
TH
ALE
S C
omm
unic
atio
ns.
Evaluation mode mono locuteur
• Choix des neufs locuteurs Bref (4F, 5H)
• j5f, j6f, j8f, jbf
• j7m, jdm, jym, k1m, k6m
• Définition du corpus d ’apprentissage pour chaque locuteur
• Génération des modèles HMM en cours
• Diffusion utilitaire sv56 (ITU STL2000)
normalisation en énergie des signaux (-26 dB overload)
Avancement SYMPATEX 5/5
Les
info
rmat
ions
con
tenu
es d
ans
ce d
ocum
ent
sont
la p
ropr
iété
exc
lusi
ve d
u G
roup
e T
HA
LES
. E
lles
ne d
oive
nt p
as ê
tre
divu
lgué
es s
ans
l'acc
ord
écrit
de
TH
ALE
S C
omm
unic
atio
ns.Codage de la prosodie
•Alternative au codage du pitch> modèle :
• F0_est(n) = g(n) * F0_syn(n)
•g(n) = (a * n) + b
> quantification de la moyenne de F0_est(n) sur un segment (5 bits/6 bits)
> quantification non uniforme de a, (b est estimé au décodeur)
• Modification du critère de sélection des segments>pré-sélection des segments de référence par critère de proximité sur le F0 moyen
>1er critère• ré-échantillonnage des spectres à F0 = 100 Hz
•calcul d ’un spectre moyen du segment à coder, et du segment de référence
•mesure d ’inter-corrélation normalisée sur les spectres
>2ème critère•calcul du profil énergétique sur le segment à coder, et du segment de référence (normalisé)
•mesure d ’inter-correlation normalisée des profils énergétiques
>3ème critère : idem 2ème critère appliqué au pitch
Avancement SYMPATEX 6/5
Les
info
rmat
ions
con
tenu
es d
ans
ce d
ocum
ent
sont
la p
ropr
iété
exc
lusi
ve d
u G
roup
e T
HA
LES
. E
lles
ne d
oive
nt p
as ê
tre
divu
lgué
es s
ans
l'acc
ord
écrit
de
TH
ALE
S C
omm
unic
atio
ns.
Estimation du débit
Codage de la classe identifiée (64) 6 bits
Codage du segment (16 parmi N) 4 bits
Codage du pitch moyen 6 bits (5)
Codage du paramètre a (pitch) 6 bits (5)
Codage du gain correcteur 6 bits (5)
Codage longueur (3 à 18 trames) 4 bits
TOTAL 32 bits/segment (29)
50 ms/segment = 20 segments/sec = 640 bits/sec (580)
60 ms/segment = 16,7 segments/sec = 533 bits/sec (483)
Avancement SYMPATEX 7/5
Les
info
rmat
ions
con
tenu
es d
ans
ce d
ocum
ent
sont
la p
ropr
iété
exc
lusi
ve d
u G
roup
e T
HA
LES
. E
lles
ne d
oive
nt p
as ê
tre
divu
lgué
es s
ans
l'acc
ord
écrit
de
TH
ALE
S C
omm
unic
atio
ns.
Présentation du projet SYMPATEX
• Colloque RNRT à Lille
Lundi 27 janvier 2003 - 16h30/18h30
Poster (à envoyer avant le 20 décembre 2002)
• Contributions ?
Avancement SYMPATEX 8/5
Les
info
rmat
ions
con
tenu
es d
ans
ce d
ocum
ent
sont
la p
ropr
iété
exc
lusi
ve d
u G
roup
e T
HA
LES
. E
lles
ne d
oive
nt p
as ê
tre
divu
lgué
es s
ans
l'acc
ord
écrit
de
TH
ALE
S C
omm
unic
atio
ns.
Conclusion• Bilan de la réunion
- Liste des actions décidées et en cours
• Date et lieu de la prochaine réunion d’avancement