roger phan-tan-luu université paul cézanne - france methodologie de la recherche experimentale...
TRANSCRIPT
Roger Phan-Tan-LuuRoger Phan-Tan-Luu
Université Paul Cézanne - FranceUniversité Paul Cézanne - France
METHODOLOGIE DE LA RECHERCHE EXPERIMENTALE
Méthodologie de la Recherche Méthodologie de la Recherche ExpérimentaleExpérimentale
* Ce résultat doit nous
apporter une
information qui
correspond bien à
l’information demandée
* L’information ainsi
obtenue doit être de
bonne qualité, pour que
nous puissions, à partir de
celle-ci, prendre une
décision avec un risque
minimum
Cas ideal : il n’y a pas d’erreur expérimentale
Le résultat de la mesure nous donne
Cas normal : l’erreur expérimentale existe
yi = I + ei
Le résultat de la mesure ne nous donne
que y
yi est une estimation de i
* Pour améliorer la qualité de
l’information obtenue, il suffit
d’augmenter le nombre
d’essais
* Pour améliorer la qualité de
l’information obtenue à partir
du modèle, en plus de la
qualité apportée par la
mesure,il faudra aussi compter
avec les conditions
d’expérimentations
* Pour améliorer la qualité de l’information obtenue, il suffit
d’augmenter le nombre d’essais
Soit N essais répétés (honnêtement)
y1, y2, …, yN
Ymoyen = yi/N Var (ymoyen) = 2 / N
* Pour améliorer la qualité de l’information obtenue à partir du
modèle, en plus de la qualité apportée par la mesure,il faudra
aussi compter avec les conditions d’expérimentations
Cas normal : l’erreur expérimentale existe
y2 = 0 + 1 x2 + e2
y1 = 0 + 1 x1+ e1
(y2 - y1) / (x2 – x1) = (2+ e2 - 1 – e1) / (x2 – x1)
= (2 - 1 + e2 – e1) / (x2 – x1)
= (2 -1) / (x2 – x1) + (e2 – e1) / (x2 – x1)
b1= 1 + (e2 – e1) / (x2 – x1)
yi = i+ ei= 0 + 1 xi+ ei
b1= 1 + (e2 – e1) / (x2 – x1)
Pour obtenir une bonne estimation de 1 :
b1 1
Il faut et il suffit que :
(e2 – e1) / (x2 – x1) 0
(x2 – x1) doit être le plus grand possible
La qualité de l’information obtenue dépend de la
position des points expérimentaux.
Y
X
yexp, 3
x1
y1
x6
y6
x7
y7
x2
y2
ycalc, 3
yexp, 3 - ycalc, 3
x3
y3
y5
x5x4
y4
S. C. E = (yexp, i - ycalc, i )2
L = (yi – 0 – 1xi )2
Nb0 + b1 xi = yi
b0 xi + b1 xi 2 = yi xi
0)(2
0)(2
101
100
xxy
xy
iii
ii
L
L
b0 = y moyen – b1 x moyen
b1 = Sxy / SxxSxy = yi (xi - x moyen )2
Sxx = (xi - x moyen )2
Var(b1) = Var (Sxy / Sxx) = Var (Sxy) / S2xx
Var(b1) = Var ( yi (xi - x moyen )2 ) / S2xx
Var ( yi (xi - x moyen )2 ) = 2 (xi - x moyen )2
Var (b1 ) = 2 / Sxx
Var (b0 ) = 2 [ 1/N + x moyen 2 / Sxx ]
REPRESENTATION VECTORIELLE
Définitions :
Y : vecteur colonne de la réponse expérimentales yi
Y' : { y1, y2,…… yN }
: vecteur colonne de la réponse théoriques i
' : { 1, 2, ….. N }
REPRESENTATION VECTORIELLE suite
: vecteur colonne des coefficients du modèle à estimer i
' : { 0 , 1 , 2 , …. p}
B : vecteur colonne des estimateurs bi
B' : {b0 , b1 , b2 , …. bp}
: vecteur colonne des erreurs expérimentales ei
' : {e1 , e2 , ..... eN}
Notation matricielle classique
= X y = X +
METHODE DES MOINDRES CARRES
La méthode des moindres carrés ne nécessite aucune hypothèse
sur la distribution des erreurs expérimentales
L = (Y – X ) ‘(Y – X )
X'X B = X'Y
B = (X'X)-1 X'Y si det (X'X) 0
0L
METHODE DES MOINDRES CARRES
Si la matrice (X’X) n’est pas singulière, nous obtenons le vecteur
des estimations :
B = (X'X)-1 X'Y
X’X : matrice d’information
(X’X)-1 : matrice de dispersion
Si le modèle y = X + est correct, B est une estimation non
biaisée de ,
MATRICE DE VARIANCE – COVARIANCE DE B
Var [B ] = (X’X)-1 2
Var [B ] : matrice de variance-covariance de B
(X’X)-1 : matrice de dispersion : { c ij }
cjj : coefficient de variance
La variance de l’estimateur bj est obtenue en multipliant la variance de
l’erreur expérimentale 2 par le terme diagonal correspondant cjj de la
matrice de dispersion
var [bj ] = cjj 2
covar [bj , bi] = cji 2
matrice de dispersion
(X'X)-1-
- 1
Var (B) = (X'X)-1
facteurs d’inflation
fonctions de variance
plan d’expérimentation
expérimentation
Y
B = (X'X)-1X'Y
tests statístiques
REGRESSION
MULTILINEAIRE
matriced’expériences
N
modèle
matrice du modèle
X
matrice d’ information
X'X
La variance et la covariance d’un estimateur dépendent
seulement de:
- la variance de l’ erreur expérimentale 2
- des éléments de la matrice de dispersion (X’X)-1,
* donc des éléments de la matrice d’information (X’X),
* donc de la structure de la matrice d’expériences et
de la forme analytique du modèle,
La qualité des estimateurs est indépendante de la valeur
des résultats expérimentaux (éléments du vecteur Y),
* Le modèle doit
représenter au mieux
l’ensemble des
résultats
expérimentaux
* Le modèle doit nous
permettre de faire, dans
tout le domaine
expérimental défini, une
prévision de bonne qualité
Quelques critères a posteriori
R2 = 1 – (yi – ycalc,i)2 / (yi – ymoyen)
2
R2 : coefficient de détermination multiple
R2A : coefficient de détermination multiple adjusté
R2A = 1 – [ (yi – ycalc,i)
2 / (N – p)] / [ (yi – ymoyen)2 / (N – 1)]
Analyse des résidus
Résidus
analyse graphique
ei = yi - y calc, i
Résidus normés
Les résidus normés ont une moyenne nulle et
une variance approximativement égale à 1.
ri = ei / s
s : écart-type de la réponse
ei : résidu au point i
Si ri > 3 la valeur de la réponse au point i
doit être examinée avec soin (erreur de
transcription, artéfact, validité du modèle en ce
point,…)
Au point i y calc, i = XB
y calc, i = X(X’X)-1X’Y H = X(X’X)-1X’ (hat matrice)
y calc, i = HY
E : {ei, ei, ..., eN}
E = Y - Ycalc
E = Y – XB = Y – HY = (I - H)Y
ei = (1 – di) yi
Var (E) = Var [(I - H)Y] = (I – H) Var(Y) (I – H)’
Var (E) = 2 (I – H)
Var (ei) = 2 (1 – di) = (1 – di) 2
ri = ei / s(1 - di)
Student-R
R-student
s2(i) = [(N – p) s2 - ei
2 / (1 - di) ] / (N - p -1)
ti = ei / s2
(i) (1 - di)
si ti est très différent de ri, alors le point i a
une grande influence sur le calcul des
coefficients du modèle
ri = ei / s(1 - di)
PRESS (Prediction Error Sum of Square)On fait la régression en enlevant le point i et en chacun des (N – 1) points on calcule Y calc, (i)
au point i e (i) = yi - y calc, i
La procédure est répétée pour chaque point (i : 1,., N)
e(1), …e(i), … e(N)
PRESS = e(i)2 = [ei /(1 - di)]
2
R2
Prédiction
R2 prédiction = 1 – PRESS / yi2
Ces critères permettent de choisir, de construire, un ensemble d’expériences qui nous apporteront les informations désirées avec une qualité acceptable.
Elaborer une stratégie Elaborer une stratégie expérimentaleexpérimentale
choisir une stratégie expérimentale
adéquateadéquate
C’est une
droite
Est-ce une droite
?
Une expérience apporte toujours une information
Mais, cette information est-elle utile ?
Dominio de validaciónC’est une droite
Dominio de validación
Est-ce une droite ?
N = 2N = 2N = 2
Et si nous faisions 50
points ?
25 25
N = 50
Dominio de validación
Est-ce une droite ?
N = 2N = 2N = 2
N = 3
Toute l’information se trouve dans la
distribution des points expérimentaux
Dominio de validación
C’est une droite
var (b1) = 2 / (xi – xmoyen)2
(xi–xmoyen)2 = (x1–xmoyen)2
+
5 (xj–xmoyen)2 +
(xn–xmoyen)2
1 j n
Modéles linéaires, …
* Nous voulons connaître les
estimations des coefficients
du modèle avec une qualité
acceptable
* Nous voulons connaître en
n’importe quel point du domaine
expérimental d’intérêt, la valeur
de la réponse étudiée avec une
qualité acceptable
Modéles linéaires, …
* Nous voulons connaître les
estimations des coefficients
du modèle avec une qualité
acceptable
* Nous voulons connaître en
n’importe quel point du domaine
expérimental d’intérêt, la valeur
de la réponse étudiée avec une
qualité acceptable
Le criblage des facteurs
Les études quantitatives des
facteurs
rechercher rapidement, parmi un ensemble de facteurs potentiellement influents, ceux qui le sont effectivement dans un domaine expérimental fixé.
étudier les effets principaux et les effets d’interaction des facteurs.
Facteurs d’inflation
Le criblage des facteurs
Les études quantitatives des
facteurs Nous voulons connaître les estimations des coefficients du modèle :
poids des facteurs, effets principaux et effets d’intéraction,..
avec une qualité acceptable.
Modéles linéaires, …
* Nous voulons connaître les
estimations des coefficients
du modèle avec une qualité
acceptable
* Nous voulons connaître en
n’importe quel point du domaine
expérimental d’intérêt, la valeur
de la réponse étudiée avec une
qualité acceptable
Les études quantitatives des réponses
Les mélanges
Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs réponses
expérimentales .
Connaissance d'une ou plusieurs propriétés, dépendant de la proportion de chaque constituant dans le mélange étudié.
Connaître en n'importe quel point du domaine
expérimental d'intérêt la valeur d'une ou
plusieurs réponses expérimentales
Trouver, s’il existe, le domaine dans lequel
toutes les réponses expérimentales respectent
les contraintes imposées par le cahier des
charges
zone de compromis acceptable
Que voulons-nous ?
Le modèle doit bien représenter le
phénomène étudié dans le domaine
expérimental d’intérêt
Si cela est vérifié, il doit permettre de
prévoir, en n’importe quel point de ce
domaine expérimental d’intérêt, la valeur de
la réponse expérimentale étudiée avec une
bonne qualité prévisionnelle
Quelles doivent être les qualités du modèle ?
Si le modèle est vérifié, il doit permettre de
prévoir, en n’importe quel point de ce
domaine expérimental d’intérêt, la valeur de
la réponse expérimentale étudiée avec la
même qualité que celle que nous aurions eue
si nous avions fait l’expérience en ce même
point.
Que voulons nous ?
2750 g2500 g 3000 g
360 sec
270 sec
2500 g
A
180 sec
Var (y exp ,A) = 2
Var (y calc ,A) = dA2
Si le modèle est vérifié, il doit permettre de
prévoir, en n’importe quel point de ce
domaine expérimental d’intérêt, la valeur de
la réponse expérimentale étudiée avec la
même qualité que celle que nous aurions eue
si nous avions fait l’expérience en ce même
point.
Que voulons nous ?
d Max 1
Les études quantitatives des réponses
Les mélanges
Fonction de variance maximale dans tout le domaine d’intérêt
dMax
Connaître, en n’importe quel point du domaine expérimental d’intérêt, la valeur de la réponse expérimentale étudiée avec une qualité acceptable.
Les expériences coûtent cher, prennent du temps,
consomment des produits, de l’énergie ....
et en plus, ne sont pas importantes
Il n’y a aucune information dans le résultat
d’une expérience !
Toute l’information se trouve dans la
distribution des points expérimentaux
Comment savoir si l’objectif est atteint ?
mesure
réponse expérimentale
Description du problèmeDescription du problème
Les objectifsLes objectifs
Etablir la liste des réponses
Réponse expérimentale
Qualités:
pertinente, reproductibleconnue avec une précision acceptable.
La réponse est un résultat et il n’est pas
possible d’agir directement sur sa valeur
SORTIE
REPONSES EXPERIMENTALES
Etude d’un procédé CVD tungstène vitesse de dépôt, résistivité,
réflectance, adhésion, recouvrement, tension.
Optimisation de la géométrie d’une boîte de boisson résistance au choc, quantité d’aluminium, volume utile.
Fabrication d’un comprimé dureté, friabilité, indice de cohésion, granulométrie, rapport de transmission
Catalyse par transfert de phase rendement de la réaction
Comment modifier la réponse expérimentale ?Il faut agir
indirectement
Facteurs
ENTREE
L’expérimentateur peut agir directement sur
la valeur que peut prendre un facteur
contrôlé.
ENTREEENTREE SORTIESORTIEPhénomènePhénomène
RéponsesRéponsesFacteursFacteurs
Granulométrie
Friabilité
Dureté
Rapport de transmissionIndice de cohésion
- Liquide de mouillage- Temps de malaxage
Etablir la liste des facteurs
étudiés non étudiés
Etablir la liste des réponses
Description du problèmeDescription du problème
Les objectifsLes objectifs
Domaine de variation des facteurs
L'ensemble des niveaux (ou états) que peut prendre un facteur, peut être défini :
en extension
tous les niveaux (ou états) sont énumérés
en compréhension
énoncé de propriétés caractéristiques
Type de fruits secs : 40 % noisettes du Piémont noisettes turques amandes de Valence amandes de Sfax
Type de matières grasses : 15 % beurre de cacao beurre concentré biscuitine toffita
Type de produits de chocolat : 15 %
chocolat noir chocolat au lait masse de cacao
Type de produits / matière sèche : 30 % sucre glace lactosérum dextrose farine de soja
E
T
U
D
E
D
‘
U
N
C
H
O
C
O
L
A
T
Les différents états que peut prendre un facteur
Nous devons, avant toute expérimentation bien définir sa taille, sa
forme, les possibilités d'extension, les discontinuités
soupçonnées du phénomène...
DOMAINE EXPERIMENTAL D’INTERET
Le domaine expérimental possible (ou domaine d'opérabilité) est le
sous-ensemble du domaine des facteurs contenant les
expériences réalisables. Dans la pratique, ce domaine est souvent
lui-même réduit au domaine expérimental d'intérêt dans lequel
nous recherchons les informations désirées.
Domaine expérimental d’intérêt
Etablir la liste des facteurs
étudiés non étudiés
Etablir la liste des réponses
Description du problèmeDescription du problème
Les objectifsLes objectifs
Nous devons faire des expériences
Lesquelles ?
Celles qui nous amènent les informations désirées
Stratégie expérimentale
Elaborer une stratégieElaborer une stratégie
Etablir la liste des facteurs
étudiés non étudiés
Etablir la liste des réponses
Description du problèmeDescription du problème
Les objectifsLes objectifs
Domaine expérimental d’intérêt
Stratégie expérimentale
Plan d’expériences
Ensemble d’expériences dont la réalisation apporte des informations bien définies
Construire un plan Construire un plan d’expériencesd’expériences
Etablir la liste des facteurs
étudiés non étudiés
Etablir la liste des réponses
Description du problèmeDescription du problème
Les objectifsLes objectifs
Domaine expérimental d’intérêt
Recherche exploratoire
Elaborer une stratégie Elaborer une stratégie expérimentaleexpérimentale
choisir une stratégie expérimentale
adéquateadéquate
Criblage de facteurs
Optimisation
Etude quantitative de facteurs
La recherche exploratoire :
cerner le domaine expérimental, s'assurer de la maîtrise du phénomène, choisir les grandeurs qui serviront de réponses et contrôler la répétabilité.
Le criblage des facteurs :
rechercher rapidement, parmi un ensemble de facteurs potentiellement influents, ceux qui le sont effectivement dans un domaine expérimental fixé.
Les études quantitatives des facteurs :
étudier les facteurs retenus d'une façon plus fine : interactions possibles entre les différents facteurs.
Les études quantitatives des réponses Rechercher l'optimum d'une ou plusieurs réponses expérimentales
Connaître en n'importe quel point du domaine expérimental d'intérêt la valeur d'une ou plusieurs
réponses expérimentales .
Les mélanges :
formulation = étude de l'influence des proportions de plusieurs constituants sur les manifestations d'un phénomène physico-chimique.
Connaissance d'une ou plusieurs propriétés, dépendant de la proportion de chaque constituant
dans le mélange étudié.