chapitre 3 : la relativite restreinte´chapitre 3 : la relativite restreinte´ 3.1 la transformation...
TRANSCRIPT
Chapitre 3 : La relativite restreinte
3.1 La transformation de Galilee et les difficultes de la physique prerelativiste
3.2 Experience de Michelson-Morley et determination intuitive
de la transformation de Lorentz
3.3 La transformation de Lorentz : approche standard
3.4 Dilatation du temps et contraction des longueurs
3.5 L’espace-temps de Minkowski et la distance spatio-temporelle
3.6 L’effet Doppler longitudinal
3.7 La mecanique relativiste du point materiel
134
Chapitre 3 : La relativite restreinte
3.1 La transformation de Galilee et les difficultes de la physique prerelativiste
Considerons deux systemes de reference d’inertie S et S en mouvement de translation recti-
ligne et uniforme l’un par rapport a l’autre (voir Figure 3.1). Chaque systeme est pourvu d’horloges
identiques aussi nombreuses qu’on voudra et toutes les horloges de S sont supposees synchro-
nisees, de meme que toutes les horloges de S. La synchronisation pourra se faire par exemple
a l’aide de tiges rigides qui permettent en principe a deux observateurs d’un meme systeme de
reference d’echanger des signaux a vitesse infinie. De plus, on admet, toujours en physique clas-
FIGURE 3.1 –
sique, que les horloges de S et les horloges de S peuvent etre synchronisees entre elles, ce qui
revient a admettre que si une horloge de S indique a un certain moment le meme temps que l’hor-
loge de S qui lui est voisine au moment en question, alors cette horloge de S indiquera toujours le
meme temps que l’horloge de S qui lui sera alors voisine et cela quels que soient les mouvements
de l’horloge de S consideree. Cette hypothese de synchronisation des horloges en mouvement
permet d’ecrire la relation
t = t
ou t et t designent les temps dans S et dans S d’un meme evenement, par exemple la collision
entre deux particules, c’est-a-dire les temps indiques lorsque l’evenement en question se produit
sur l’horloge de S et sur l’horloge de S qui se trouvent en ce moment au voisinage de l’endroit
de l’espace ou cet evenement a lieu. Cette derniere relation definit une des proprietes les plus
importantes du temps classique : son caractere absolu. Si on considere deux evenements 1 et 2 et
135
si on pose
∆t = t2 − t1 , ∆t = t2 − t1 ,
on a naturellement : ∆t = ∆t
comme consequence de la relation precedente ecrite pour chacun des deux evenements en ques-
tion. La duree d’un phenomene est donc une grandeur absolue. Il en est de meme de la notion
de simultaneite, car si les deux evenements en question sont simultanes dans S, c’est-a-dire si
∆t = 0, on a egalement ∆t = 0 et les deux evenements sont egalement simultanes dans S, quelles
que soient leurs localisations spatiales.
Soit alors ~V la vitesse, constante de S par rapport a S. Par un choix approprie des axes attaches
a S et a S, il est toujours possible de faire en sorte que les axes x et x glissent l’un sur l’autre et
que les axes y et y d’une part et z et z d’autre part restent constamment paralleles. On peut donc
ecrire 1 : x = x+ V t
y = y
z = z
t = t
(3.1)
en vertu de l’hypothese relative a la synchronisation des horloges en mouvement. Dans ces re-
lations, qui constituent la transformation de Galilee speciale, x, y, z, t et x, y, z, t designent les
coordonnees et le temps d’un meme evenement quelconque dans S et S, respectivement.
La transformation de Galilee generale est obtenue en considerant en plus une rotation et une
translation des axes dans chaque systeme de reference et une translation du temps. Sa forme est
donc, en ecriture vectorielle : {~r = ~r + ~V t+ ~a
t = t+ b(3.2)
ou ~a et b sont des constantes quelconques. Ou encore, en projetant l’equation vectorielle sur les
axes xi , en tenant compte de : ~ei = Aij ~je{xi = Aij(xj + Vj t+ aj)
t = t+ b(3.3)
Les transformations de Galilee speciales forment un groupe a un parametre et les transformations
de Galilee generales un groupe a dix parametres : Aij (3), Vi (3), ai (3), b (1).
Les lois de composition des vitesses et des accelerations resultent directement de la transfor-
mation de Galilee. Partant de la forme vectorielle, on a en effet, si on considere une particule en
1. En supposant que les horloges attachees en O et en O indiquent toutes deux le temps zero au moment ou elles
coıncident.
136
mouvement (succession continue d’evenements) :
~v =d~r
dt=d~r
dt=d~r
dt+ ~V = ~v + ~V (3.4)
et
~γ =d~v
dt=d~v
dt=d~v
dt= ~γ (3.5)
Ce dernier resultat conduit a l’invariance galileenne de la mecanique classique, c’est-a-dire a l’idee
que tous les systemes d’inertie sont rigoureusement equivalents du point de vue des phenomenes
mecaniques. En d’autres termes, les lois de la mecanique classique de Newton ont la meme forme
dans tous les systemes d’inertie (principe de relativite classique).
D’autre part, des la fin du XIX eme siecle, il devint clair que ce principe de relativite classique
ne semblait pas s’etendre aux phenomenes electromagnetiques et optiques, puisque les equations
de Maxwell (1831-1879), etablies en 1865, qui regissent ces phenomenes ne sont pas invariantes
par rapport aux transformations de Galilee, ou du moins ne seraient invariantes par rapport a ces
transformations des variables d’espace et de temps, que si l’on admettait pour le champ electromagneti-
que et pour les densites de charge et de courant des lois de transformation extremement com-
pliquees et inelegantes. En d’autres termes, il devint clair, et le premier a l’apercevoir tres distinc-
tement fut sans doute Poincare, qu’il existe une antipathie profonde entre les equations de Maxwell
et la transformation de Galilee.
Au cours du XIX eme siecle, cette antinomie etait resolue de facon plus ou moins explicite
en acceptant sans reserve la transformation de Galilee, et en admettant par consequent que les
lois de l’electromagnetisme n’avaient pas la meme forme dans tous les systemes d’inertie. Ainsi,
les equations de Maxwell n’etaient regardees comme rigoureusement valables que par rapport a un
certain systeme d’inertie privilegie que l’on supposait defini par l’ether, ce tres hypothetique milieu
materiel devant servir de support a la propagation des ondes electromagnetiques. C’est dans cet
esprit essentiellement mecaniste que toutes les experiences optiques et electromagnetiques etaient
alors interpretees, ce qui, dans la plupart des cas, donnait lieu soit a de tres reelles difficultes,
soit a la necessite de faire des hypotheses toujours tres artificielles sur les proprietes cinematiques
de l’ether : etait-il entraıne par la Terre, ou bien par les corps en mouvement, ou partiellement
entraıne ? etc.
En fait, la situation n’est pas simple et il ne peut etre question de discuter ici ces nombreuses
experiences dont l’etude releve d’un cours de physique generale (cf. E. Taylor et J.A. Wheeler,
1992, dans le livre SpaceTime Physics : introduction to special relativity, W.H. Freeman and Com-
pany, New York).
Mentionnons que dans certains cas, ces explications classiques paraissaient satisfaisantes : c’est
ce qui se passe pour le phenomene d’aberration decouvert par l’astronome Bradley en 1725 et
137
pour l’effet Doppler decouvert par Doppler en 1842. Dans d’autres cas, l’interpretation classique
est possible mais ne semble pas tres naturelle, car elle repose sur un certain degre d’entraınement
de l’ether par les corps en mouvement : c’est ce qui se passe par exemple dans l’experience de
Fizeau de 1851, dont nous dirons quelques mots plus loin. Enfin, dans le cas de l’experience de
Michelson-Morley, les difficultes d’interpretation furent beaucoup plus considerables. Le but de
cette experience, realisee par Michelson en 1881, puis par Michelson et Morley en 1887, etait de
mesurer la vitesse de l’ether par rapport a la Terre a l’aide d’un interferometre. Cette experience
decisive est decrite dans la section 3.2.
Le resultat remarquable obtenu par Michelson et Morley fut que l’ether est immobile par
rapport a la Terre. Une telle conclusion evidemment geocentrique parut cependant difficilement
defendable, et d’ailleurs en contradiction avec la theorie de l’aberration et avec l’experience de
Fizeau, de telle sorte qu’a la fin du XIX eme siecle, il devint evident que c’etait l’interpretation
classique de l’experience en question qui devait etre mise en cause.
Une premiere tentative d’interpretation fut d’abord proposee independamment par Fitzgerald
et par Lorentz en 1893 sous la forme d’une contraction longitudinale des corps en mouvement par
rapport a l’ether, mais cette hypothese n’eut que tres peu de succes (voir section 3.2).
Finalement, ce fut a Einstein (1879-1955) que revint le merite de clarifier completement la
situation grace a son celebre travail de 1905 publie dans les “Annalen der Physik”, sous la forme
d’un article intitule “Sur l’electrodynamique des corps en mouvement” (traduit en anglais dans
l’ouvrage The principle of relativity par Einstein, Lorentz, Weyl et Minkowski, 1923, Dover, New
York). Pour la premiere fois, du moins de facon tout a fait explicite, ce sont les notions classiques
d’ether et de cinematique galileenne qui sont ici definitivement condamnees et c’est une toute nou-
velle physique qui se trouve effectivement elaboree sur la base de deux postulats fondamentaux : le
principe de l’invariance de la vitesse de la lumiere dans le vide et le principe de relativite restreinte.
1) Principe de l’invariance de la vitesse de la lumiere dans le vide
Dans le vide, la vitesse de la lumiere est une constante universelle,
c = 2, 9979× 108 m/s ,
et possede donc la meme valeur dans tous les systemes d’inertie, quels que soient les mouvements
de la source lumineuse. De plus, la lumiere se propage dans le vide de facon rectiligne et uniforme,
par rapport a tout systeme d’inertie.
2) Principe de relativite restreinte
138
Toutes les lois de la physique (mecaniques, electromagnetiques, ...) doivent avoir la meme
forme dans tous les systemes d’inertie.
Le premier de ces principes, qui peut dans un certain sens etre considere comme une consequence
du second, implique evidemment une condamnation sans appel de la transformation de Galilee,
c’est-a-dire des notions classiques d’espace et de temps. C’est cela qui, par-dessus certaines polemi-
ques, doit etre regarde comme l’apport le plus important d’Einstein a la physique relativiste, car,
s’il est vrai de dire que les idees relativistes etaient dans l’air des la fin du XIX eme siecle et plus
particulierement dans les travaux de Lorentz (1853-1928) et de Poincare (1854-1912), il n’en reste
pas moins que ce fut bien Einstein qui par son article de 1905 fut le premier a comprendre de facon
tout a fait nette la necessite de rompre brutalement avec les vieilles idees relatives aux proprietes de
l’espace et du temps, comme en temoigne son principe de l’invariance de la vitesse de la lumiere
dans le vide, qu’il fut le premier et le seul a oser proposer. Il serait neanmoins injuste de ne pas
rappeler de nouveau les travaux de Lorentz relatifs a la structure des equations de Maxwell et peut-
etre plus encore ceux ou Poincare insiste sur l’antinomie existant entre la mecanique classique et
l’electromagnetisme et sur l’interet qu’il pourrait y avoir a creer une nouvelle mecanique qui serait
en harmonie avec l’electromagnetisme, de telle sorte que le principe de relativite soit applicable a
tous les phenomenes physiques et non plus seulement aux phenomenes mecaniques.
En 1955, Einstein ecrivait d’ailleurs, quelques mois avant sa mort :
”There is no doubt, that the special theory of relativity, if we regard its devopment in retrospect,
was ripe for development in 1905. Lorentz had already observed that for the analysis of Maxwell’s
equations the transformations which later were known by his name are essential, and Poincare had
even penetrated deeper in these connections. Concerning myself, I knew only Lorentz’s important
work of 1895 (”La theorie electromagetique de Maxwell” and ”Versuch einer Theorie der elektri-
schen und optischen Erscheinungen in bewegten Korpen”) but not Lorentz’s later work, nor the
consecutive investigations by Poincare. In this sense, my work of 1905 was independent. The new
feature of it was the realization of the fact that the bearing of the Lorentz-transformations trans-
cended their connection with Maxwell’s equations and was concerned with the nature of space and
time in general. A further new result was that the ”Lorentz invariance” is a general condition for
any physical theory. This was for me of particular importance because I had already previously
found that Maxwell’s theory did not account for the micro-structure of radiation and could there-
fore have no general validity”.
139
3.2 Experience de Michelson-Morley et determination intuitive de la trans-formation de Lorentz
La description de l’experience de Michelson-Morley ainsi que la determination intuitive de la
transformation de Lorentz seront effectuees dans le cadre des seances de travaux pratiques.
140
3.3 La transformation de Lorentz : approche standard
La relativite restreinte ne considere que des systemes de reference d’inertie rigoureusement
equivalents, quels que soient les phenomenes physiques consideres : soit le systeme de Copernic,
qui ne doit donc en aucune maniere etre regarde comme un systeme d’inertie privilegie, soit tout
systeme anime d’un mouvement de translation rectiligne et uniforme par rapport a lui ; c’est dans
ce sens qu’il faut comprendre le mot “restreinte”.
Un systeme d’inertie est encore considere comme etant une structure rigide pourvue d’horloges
identiques et synchronisees et le mouvement rectiligne et uniforme est naturellement defini comme
en physique classique. Ce qui est nouveau cependant, c’est la maniere dont on effectue la synchro-
nisation des horloges d’un meme systeme d’inertie, en utilisant des signaux lumineux (principe
de l’invariance de c) et non plus des regles supposees rigides ; ce qui est egalement nouveau, et
fondamental, c’est l’abandon du principe classique de synchronisation des horloges mobiles avec
celles au repos.
Considerons deux systemes d’inertie et choisissons les axes comme il est indique sur la figure
3.2. Toutes les horloges de S sont synchronisees entre elles et il en est de meme pour les horloges
FIGURE 3.2 –
de S. Nous pouvons egalement supposer que lorsque l’horloge de S qui est situee en O “coıncide”
avec l’horloge de S situee en O, ces deux horloges indiquent toutes les deux le temps 0. Bien
entendu nous ne supposons pas que l’horloge O indique toujours le meme temps que l’horloge de S
avec laquelle elle coıncide. Comme nous le verrons plus loin, il resulte du principe de l’invariance
de c que ceci est justement impossible : en d’autres termes, le principe de l’invariance de c entraıne
que la synchronisation des horloges mobiles est impossible (cf. plus loin la dilatation du temps).
Soit alors un evenement quelconque, c’est-a-dire quelque chose qui est parfaitement localise
dans l’espace et dans le temps, par exemple la collision entre deux particules ponctuelles, et soient
141
x, y, z, t et x, y, z et t les coordonnees d’espace et de temps de cet evenement dans les deux
systemes d’axes et d’horloges consideres.
Notre but est de rechercher les relations qui existent entre x, y, z, t et x, y, z, t en partant
du principe de l’invariance de c et du fait que la transformation de Galilee doit etre d’une certaine
maniere une forme approchee de ces relations. En d’autres termes, il faut modifier la transformation
de Galilee, mais aussi peu que possible, afin que la nouvelle transformation soit en accord avec le
principe d’invariance de c.
On a tout d’abord
y = y
z = z
puisque les plans x z et x z, d’une part, et x y et x y, d’autre part, sont identiques.
D’autre part, par analogie avec la transformation de Galilee, nous supposerons que x et t sont
des fonctions lineaires 2 de x et de t, c’est-a-dire que l’on a 3
x = ax+ bt
t = fx+ gt
ou a, b, f et g designent quatre constantes a determiner 4.
Montrons maintenant que ces quatre constantes sont parfaitement determinees par le principe
de l’invariance de c.
Considerons tout d’abord l’ensemble des evenements localises en O, c’est-a-dire le mouvement
ou l’histoire de O. Pour ces evenements :
x = y = z = 0 ,
2. Le caractere lineaire de la transformation en question entraıne evidemment l’invariance du mouvement rectiligne
et uniforme, c’est-a-dire que si une particule est animee par rapport a S d’un mouvement rectiligne et uniforme (x,
y, z fonctions lineaires de t), alors cette particule est egalement animee par rapport a S d’un mouvement rectiligne et
uniforme, puisqu’en vertu de la transformation lineaire en cause, x, y, z sont alors des fonctions lineaires de t. Bien
entendu, ces mouvements sont caracterises par des vitesses en general differentes ; mais dans le cas ou la particule est
un photon, ces deux vitesses sont egales en module. En d’autres termes, la linearite postulee ici entraıne l’invariance
du mouvement rectiligne et uniforme, tout comme en mecanique classique et est donc en particulier compatible avec
le principe selon lequel la lumiere (photons) se propage dans le vide selon des mouvements rectilignes et uniformes,
quel que soit le systeme d’inertie considere.3. Ces relations sont homogenes a cause de nos hypotheses sur le choix des axes et des horloges. Il suffit pour le
voir de considerer l’evenement “coıncidence de O et de O”.4. Constantes qui sont donc les memes pour tous les evenements, mais qui dependent evidemment de la vitesse
relative V des deux systemes consideres.
142
et par suite :
x = b t
t = g t
ou encore
x =b
gt .
On a donc, d’apres la definition de V ,b
g= V
Considerons ensuite le mouvement d’une particule quelconque, c’est-a-dire la succession conti-
nue des evenements qui constituent l’histoire de la particule. Portons notre attention sur deux de
ces evenements, supposes infiniment voisins :
E : x, y, z, t ; x, y, z, t
E ′ : x+ ∆x, etc. ; x+ ∆x, etc.
On a naturellement 5
~v = lim
(∆x
∆t,∆y
∆t,∆z
∆t
)et
~v = lim
(∆x
∆t,∆y
∆t,∆z
∆t
)lorsque E ′ tend vers E.
Si nous ecrivons les relations generales :
x = ax+ bt
y = y
z = z
t = fx+ gt
pour l’evenement E et pour l’evenement E ′ et si nous soustrayons membre a membre, nous obte-
nons evidemment∆x = a∆x+ b∆t
∆y = ∆y
∆z = ∆z
∆t = f∆x+ g∆t
5. On remarquera que ~v et ~v sont les vitesses de la particule au meme evenement E.
143
a cause du caractere lineaire des relations en cause. Des lors, il vient :
∆x
∆t=a
∆x
∆t+ b
f∆x
∆t+ g
∆y
∆t=
∆y
∆t
f∆x
∆t+ g
∆z
∆t=
∆z
∆t
f∆x
∆t+ g
En passant a la limite, on obtient donc les relations :
vx =avx + b
f vx + g
vy =vy
fvx + g
vz =vz
fvx + g
qui constituent la loi relativiste de composition des vitesses 6.
Elevant ces trois equations au carre et additionnant :
v2 =v2 + (a2 − 1)v2
x + 2abvx + b2
(fvx + g)2.
Dans le cas d’un photon (quantum de lumiere) se propageant dans le vide, cette relation devient :
c2 =c2 + (a2 − 1)v2
x + 2abvx + b2
(fvx + g)2.
en vertu du principe de l’invariance de c. Cette derniere equation s’ecrit encore :
(a2 − 1)v2x + 2abvx + b2 + c2 = c2(f 2v2
x + 2fgvx + g2)
et doit etre identiquement satisfaite quel que soit vx puisque la direction de ~v est tout a fait arbi-
traire 7 .
6. Sous forme vectorielle :
~v =~v + [(a− 1) ~v·
~VV + b]
~VV
f ~v·~VV + g
.7. −c ≤ vx ≤ c
144
On a donc :a2 − 1 = c2f 2
ab = c2fg
b2 + c2 = c2g2.
Reciproquement, ces dernieres relations entraınent le principe de l’invariance de c, en ce sens
que v = c entraıne alors bien v = c.
En resume, la transformation :x = ax+ bt
y = y
z = z
t = fx+ gt
entraıne une loi de composition des vitesses qui est compatible avec le principe d’invariance de c
si et uniquement si les quatre constantes a, b, f et g obeissent aux relations :
a2 − 1 = c2f 2
ab = c2fg
b2 + c2 = c2g2.
Compte tenu deb
g= V
et de la condition naturelle :
limV→0
(a b
f g
)=
(1 0
0 1
)qui permet de determiner les signes univoquement, ces trois conditions donnent pour a, b, f et g la
solution unique :
a =1√
1− V 2
c2
, b =V√
1− V 2
c2
,
f =Vc2√
1− V 2
c2
, g =1√
1− V 2
c2
.
Cette solution implique que V doit toujours etre inferieur a c, en accord avec l’idee relativiste
selon laquelle c est une vitesse limite, qu’aucun corps materiel ne saurait atteindre, ni bien entendu
depasser.
145
En definitive, la transformation qui se substitue a la transformation de Galilee et qui porte le
nom de transformation de Lorentz est 8
x =x+ V t√1− V 2
c2
y = y
z = z
t =Vc2x+ t√
1− V 2
c2
(3.6)
On remarquera qu’elle depend de c et qu’elle tend vers la transformation de Galilee lorsqu’on y
fait formellement tendre c vers l’infini.
La transformation de Lorentz etait en fait connue depuis plusieurs annees lorsqu’Einstein la
redecouvrit en 1905 a partir de son principe de l’invariance de c, en suivant une demonstration qui
est essentiellement celle donnee ci-dessus. En 1877, Voigt utilise deja la transformation de Lorentz
dans la theorie elastique de la lumiere, en constatant que cette transformation laisse l’equation de
d’Alembert :∂2ψ
∂x2+∂2ψ
∂y2+∂2ψ
∂z2− 1
c2
∂2ψ
∂t2= 0
invariante (en forme) si ψ est lui-meme invariant (en nombre). En 1899, Lorentz decouvre que
les equations de Maxwell sont egalement invariantes (en forme) par rapport a cette meme trans-
formation, si on admet que le champ electromagnetique et les densites de charge et de courant se
transforment selon certaines lois appropriees. La transformation de Lorentz fut egalement utilisee
par la suite par Larmor et Poincare, mais toujours comme un simple outil mathematique, sans si-
gnification physique vraiment fondamentale 9. Lorentz employait par exemple la transformation de
Galilee et la transformation de Lorentz simultanement et distinguait soigneusement les variables
8. Sous forme vectorielle, on a, avec ~r = ~OP et ~r = ~PO,
~r = ~r +
(1−
√1− V 2
c2
)~V · ~rV 2
+ t√1− V 2
c2
~V
t =
~V · ~rc2
+ t√1− V 2
c2
Cette forme a naturellement l’avantage de ne plus dependre de l’hypothese faite ci-dessus sur le choix des axes.9. La transformation etudiee par Lorentz en 1899 n’etait en fait que la transformation de Lorentz ecrite au premier
ordre enV
c. Les termes du second ordre furent obtenus par Larmor en 1900 et la transformation de Lorentz exacte par
Lorentz en 1903
146
d’espace et de temps figurant dans ces deux transformations : “coordonnees et temps physiques”
et “coordonnees et temps locaux”, respectivement.
Ce n’est qu’en 1905, avec Einstein, que la transformation de Lorentz prit toute son importance,
puisqu’il devint clair alors que cette transformation etait en realite la veritable transformation phy-
sique reliant les observations d’espace et de temps effectuees dans differents systemes d’inertie
sur un meme evenement quelconque. En d’autres termes, que la transformation de Lorentz devait
prendre la place de la transformation de Galilee et s’etendre ainsi a toute la physique.
L’inverse de la transformation de Lorentz s’obtient simplement en barrant et debarrant et en
changeant le signe de V . (On justifie aisement ce resultat en considerant le mouvement de O et en
remarquant que la vitesse de S par rapport a S est −~V ). On a alors :
x =x− V t√
1− V 2
c2
y = y
z = z
t =t− V
c2x√
1− V 2
c2
(3.7)
Les transformations de Lorentz considerees jusqu’ici sont dites speciales, puisqu’elles ont ete
obtenues en faisant certaines hypotheses (non essentielles) sur les axes et sur les horloges. On
obtient la transformation generale de Lorentz en combinant cette transformation speciale avec une
rotation et une translation des axes et avec une translation du temps. Si on se rappelle la forme
vectorielle donnee en bas de la page 146, il est clair que la transformation de Lorentz generale peut
s’ecrire sous la forme vectorielle suivante :
~r = ~r +
[(γ − 1)
~V · ~rV 2
+ γt
]~V + ~a
t = γ
(~V · ~rc2
+ t
)+ b
(3.8)
ou encore, en projetant l’equation vectorielle sur les axes xi :
xi = Aij
[xj +
[(γ − 1)
VkxkV 2
+ γt
]Vj + aj
]
t = γ
[Vkxkc2
+ t
]+ b
(3.9)
147
avec :
γ =1√
1− V 2/c2(3.10)
Si on fait tendre c vers l’infini dans (3.8) et (3.9), on retrouve evidemment la transformation de
Galilee generale sous forme vectorielle (3.2) et projetee sur les axes xi (3.3), respectivement.
Les transformations de Lorentz speciales forment un groupe a un parametre (V ) tandis que les
transformations de Lorentz generales forment un groupe a dix parametres : Aij (3), Vi (3), ai (3), b
(1).
En fait, la loi de composition du groupe de Lorentz, dans le cas des transformations speciales
aussi bien que generales, n’est plus la loi galileenne d’addition des vitesses, mais bien la loi rela-
tiviste de composition des vitesses qui, dans le cas general, compte tenu du resultat obtenu au bas
de la page 144 et des valeurs des quatre constantes a, b, f et g trouvees precedemment, s’ecrit :
~v =
√1− V 2
c2~v +
[1 +
(1−
√1− V 2
c2
)~V ·~vV 2
]~V
1 +~V ·~vc2
(3.11)
Cette expression se reduit bien a la loi de composition classique c’est-a-dire (3.4) si on y fait tendre
formellement c vers l’infini, c’est-a-dire en pratique si V et v sont beaucoup plus petits que c. On
remarquera encore que l’on a bien : ~v = ~v si ~V = 0, et ~v = ~V si ~v = 0.
De plus, on a
v2 − c2 =1− V 2
c2(1 +
~V ·~vc2
)2 (v2 − c2)
de sorte que v = c entraıne bien v = c, et v < c, v < c.
Lorsque tous les mouvements s’effectuent dans la meme direction, la loi de composition rela-
tiviste des vitesses se simplifie comme suit :
v =v + V
1 + vVc2
(3.12)
Il est d’ailleurs possible de demontrer directement cette relation a partir de la transformation de
Lorentz speciale (3.6) et des definitions de ~v et ~v.
En 1851, Fizeau realisa une experience interferometrique destinee a mesurer la vitesse par
rapport a la Terre d’un faisceau lumineux se propageant dans un liquide, lui-meme en mouvement
par rapport a la Terre. Le dessin 3.3 rappelle schematiquement le principe de cette experience. Si v
designe la vitesse du faisceau considere par rapport a la Terre et v sa vitesse par rapport au liquide,
et puisque tous les mouvements s’effectuent ici selon la meme direction, la loi de composition des
148
FIGURE 3.3 –
vitesses relativistes (3.12) nous permet d’ecrire 10
v =c
n(1 +
nV
c)(1 +
V
nc)−1
compte tenu de
v =c
n
ou n designe l’indice de refraction du liquide considere. Ou encore, approximativement, puisque
n est de l’ordre de l’unite et V/c beaucoup plus petit que l’unite :
v =c
n+ (1− 1
n2)V
qui est exactement la loi experimentale obtenue par Fizeau. Bien entendu, en 1851, l’interpretation
de cette loi experimentale s’effectuait en recourant a la loi de composition galileenne des vitesses
et a la notion d’ether : il en resultait que l’ether, a l’interieur du liquide, etait entraıne par le liquide
mais seulement de facon partielle, puisque sa vitesse par rapport a la Terre semblait etre 11
(1− 1
n2)V
et sa vitesse par rapport au liquide
− Vn2
L’image classique etait donc la suivante (cf. Figure 3.4) :
Vitesse de la lumiere par rapport a l’ether : c/n
10. v et v sont inferieurs a c, mais naturellement de l’ordre de c.11. c
n etait alors la vitesse de la lumiere par rapport a l’ether et non pas par rapport au liquide, comme c’est
reellement le cas.
149
FIGURE 3.4 –
Vitesse de l’ether par rapport au liquide : −V/n2
Vitesse du liquide par rapport a la Terre : V
Vitesse de la lumiere par rapport a la Terre (cinematique classique) : c/n− V/n2 + V
Bien entendu, l’image relativiste est considerablement plus simple (cf. Figure 3.5).
FIGURE 3.5 –
Vitesse de la lumiere par rapport au liquide : c/n
Vitesse du liquide par rapport a la Terre : V
Vitesse de la lumiere par rapport a la Terre (cinematique relativiste) :cn
+ V
1 + Vnc
' c
n+ (1− 1
n2)V
Mais cette simplicite n’a pu etre obtenue que par un bouleversement profond des idees clas-
siques d’espace et de temps et par l’abandon de la notion d’ether, conformement au principe de la
150
relativite restreinte. 12
Quant a la loi de composition des accelerations, elle s’obtient sans difficulte en derivant la
loi de composition des vitesses (3.11) par rapport a t et en utilisant l’expression de t donnee par
le seconde relation (3.8). La relation ainsi obtenue est relativement compliquee et, bien entendu,
differente de la loi de composition classique (3.5) ~γ = ~γ, c’est-a-dire que l’on a, en general, en
relativite
~γ 6= ~γ
ce qui implique, en vertu du principe de relativite restreinte, une condamnation capitale de la
mecanique newtonienne. Ainsi, pour le cas de la transformation speciale de Lorentz, on peut
aisement calculer l’expression de l’acceleration γ en fonction de γ
γ =dv
dt, γ =
dv
dt=dv/dt
dt/dt
En nous servant des relations de transformation speciale inverses de celles donnees en (3.7) et
(3.12), nous trouvons successivement
dv
dt=
dvdt
(1− vVc2
) + (v − V )dvdtVc2
(1− vVc2
)2
dv
dt= γ
1− V 2
c2
(1− vVc2
)2
dt
dt=
1− vVc2√
(1− V 2
c2)
et donc, finalement,
γ = γ(
√1− V 2
c2
1− vVc2
)3
confirmant qu’en general γ 6= γ. A partir de la relation precedente etablie pour le cas d’une
transformation de Lorentz speciale, on remarque que γ = 0 implique γ = 0, et vice-versa. On
peut aussi montrer pour le cas des transformations de Lorentz generales que si ~γ = 0, on a encore
~γ = 0, conformement a l’invariance du mouvement rectiligne et uniforme.
Ainsi donc, en relativite restreinte – tout comme en mecanique newtonienne – une particule
depourvue d’acceleration dans un referentiel d’inertie possede la meme propriete dans tous les
referentiels d’inertie. De facon semblable, une particule acceleree dans un referentiel d’inertie le
reste dans tous les referentiels d’inertie, bien qu’en relativite restreinte, la valeur de l’acceleration
12. En physique prerelativiste, l’ether etait non seulement, comme on l’a souvent dit, le sujet du verbe onduler,
en parlant de la lumiere ou de toute onde electromagnetique, mais c’etait aussi un systeme d’inertie privilegie et
inevitable. L’interpretation classique de la formule de Fizeau exige par exemple que l’on fasse appel a lui.
151
soit differente d’un systeme de reference d’inertie a l’autre. Ainsi donc, en relativite restreinte,
l’acceleration continue de posseder un certain caractere absolu.
Ce ne sera qu’en relativite generale, que l’acceleration perdra a son tour ce caractere absolu.
En effet, en relativite generale, il n’existe pas de systemes de reference privilegies, qu’ils soient
d’inertie ou acceleres : tous les systemes de reference y sont par principe equivalents.
152
3.4 Dilatation du temps et contraction des longueurs
a. La dilatation du temps
Considerons la situation decrite sur la figure 3.6 ou les deux horloges de S sont evidemment
synchronisees. Soient E1 la coıncidence de l’horloge H avec H1 et E2 la coıncidence de H avec
H2.
FIGURE 3.6 –
En vertu de la transformation de Lorentz speciale (3.6), on a pour tout evenement :
x =x+ V t√1− V 2
c2
, t =Vc2x+ t√
1− V 2
c2
Ecrivant ces relations pour E2 et pour E1, et soustrayant, il vient, avec des notations evidentes,
∆x =∆x+ V∆t√
1− V 2
c2
, ∆t =Vc2
∆x+ ∆t√1− V 2
c2
Or, les deux evenements consideres sont colocaux dans S :
∆x = 0
Des lors :
∆x =V∆t√1− V 2
c2
, ∆t =∆t√
1− V 2
c2
153
La relation
∆t =∆t√
1− V 2
c2
(3.13)
exprime le phenomene de dilatation du temps :
∆t > ∆t
Imaginons en effet un phenomene physique localise dans S au voisinage de H et supposons que
ce phenomene commence en E1 et finisse en E2. ∆t est la duree propre de ce phenomene et ∆t
la duree de ce meme phenomene telle qu’elle apparaıt a l’observateur S. La dilatation du temps
resulte de ce que l’on a :
duree relative > duree propre
dans le rapport 1/
√1− V 2
c2.
Ce phenomene de dilatation du temps implique evidemment que la synchronisation des hor-
loges mobiles n’est pas possible en relativite restreinte, comme le montre l’exemple ci-dessous (cf.
Figure 3.7) :
FIGURE 3.7 –
Une application bien connue de ce phenomene de la dilatation du temps est relative a l’observa-
tion au niveau du sol de certaines particules instables produites par le rayonnement cosmique a une
154
altitude d’environ 10 km. C’est le cas par exemple pour le muon µ qui possede une vie moyenne
propre :
∆t = 2× 10−6s
ainsi qu’il resulte de mesures de laboratoire. Mais les muons µ, crees au sommet de l’atmosphere
par le rayonnement cosmique, possedent par rapport a la Terre S des vitesses presque egales a c.
Par exemple :V
c= 0, 99995 ,
√1− V 2
c2= 10−2 .
La duree de vie apparente de ces muons est donc :
∆t =∆t√
1− V 2
c2
= 2× 10−4s
par rapport a la Terre.
Entre leur creation au sommet de l’atmosphere et leur desintegration, ces muons peuvent donc
parcourir par rapport a la Terre une distance egale a :
∆x = V∆t = 60 km
conformement a l’observation. Si on ne tenait pas compte de la dilatation du temps, on obtiendrait
600 m au lieu de 60 km, et on ne pourrait pas comprendre que les muons, crees a 10 km d’altitude,
soient observes au niveau du sol.
b. La contraction des longueurs
Une regle rigide AB fixe dans S est en mouvement de translation rectiligne uniforme et lon-
gitudinal par rapport a S (voir Figure 3.8). La longueur propre de la regle, l, est la distance AB
mesuree dans S, par exemple a l’aide d’une horloge et d’une source lumineuse placees en A et
d’un miroir place en B. D’autre part, il est egalement possible de definir la longueur l de la regle
relativement a S en procedant comme suit. Considerons le long de l’axe x une infinite d’horloges
fixes dans S et naturellement synchronisees.
En un meme instant t, quelconque mais fixe a l’avance, une de ces horloges, soit A, voit A en
face d’elle et de meme, en ce meme instant t, une autre horloge, soit B, voit B en face d’elle. La
longueur de la regle relativement a S, l, est alors par definition la distance mesuree dans S entre A
et B qui sont deux points fixes de S. Il est clair qu’il n’y a aucune raison pour que l et l soient a
priori egales. Pour trouver la relation entre l et l, considerons l’evenement E1 “coıncidence de A
155
FIGURE 3.8 –
et de A” et l’evenement E2 “coıncidence de B et de B”. On a :
∆x =∆x+ V∆t√
1− V 2c2
, ∆t =Vc2
∆x+ ∆t√1− V 2
c2
et aussi ∆t = 0.
Par consequent :
∆x =
√1− V 2
c2∆x (3.14)
c’est-a-dire :
l =
√1− V 2
c2l. (3.15)
On peut donc dire que pour S, la regle semble plus courte qu’elle est en realite, puisque
longueur relative < longueur propre
dans le rapport de
√1− V 2
c2a 1.
Ce phenomene de contraction des longueurs n’implique evidemment pas une modification in-
trinseque de la regle 13. Il resulte du fait que la longueur propre et la longueur relative sont definies
selon des processus operationnels tout a fait differents, qui conduisent a des resultats de mesures
differents, en vertu de la transformation de Lorentz. Ceci ne signifie nullement que la contraction
des longueurs et la dilatation du temps soient des phenomenes que nous devions regarder comme
evidents. Ils sont au contraire l’expression des proprietes relativistes de l’espace et du temps, c’est-
a-dire des regles rigides, des horloges et de la lumiere, et ces proprietes bien qu’elles ne soient
nullement illogiques ou absurdes, heurtent neanmoins fortement notre intuition, formee au contact
13. Contrairement a la contraction postulee par Lorentz et Fitzgerald en 1893, qui resultait d’une certaine interaction
physique entre les molecules de la regle et les ”molecules de l’ether”, cf. section 3.2.
156
d’une experience rudimentaire dans laquelle les vitesses V sont toujours beaucoup plus petites que
c, de sorte que le facteur de dilatation et de contraction est en pratique indiscernable de l’unite.
Revenons en a l’application interessante des muons µ observes au niveau du sol (cf. section
3.3.a). En effet, un observateur lie a un muon admettra que le temps de vie du muon est egal a
∆t = 2 × 10−6s. Pour lui, la Terre se rapproche avec une vitesse pratiquement egale a c. On ne
comprend pas a priori comment le muon pourra parcourir plus de 600m. Toutefois, en accord avec
la contraction des longueurs discutee ci-avant, la hauteur de l’atmosphere terrestre se contracte
pour lui. Si l’observateur terrestre estime que la distance (propre) a parcourir est l = 60km, elle
se reduit pour le muon a l =√
(1− (v/c)2l ' 600m. Le temps ∆t = 2 × 10−6s lui suffit donc
pour atteindre la surface de la Terre, puisque celle-ci se rapproche de lui avec une vitesse proche
de celle de la lumiere (c), de telle maniere que c∆t = 600m.
157
3.5 L’espace-temps de Minkowski et la distance spatio-temporelle
On doit a Minkowski une geometrisation de la relativite restreinte qui est de la plus grande
importance du point de vue de la visualisation et de la geometrisation de la theorie (relativite
generale, theories unifiees des diverses interactions physiques, ...).
Il s’agit en fait d’utiliser un langage geometrique fonde sur l’image d’un espace abstrait a
quatre dimensions, que l’on appelle espace-temps, dont les points representent les evenements. En
d’autres termes, un evenement est represente par un point de l’espace-temps et l’espace-temps est
regarde comme etant l’ensemble des evenements. D’autre part, un observateur S (c’est-a-dire un
systeme d’axes et un systeme d’horloges synchronisees attaches a un systeme d’inertie) caracterise
un evenement quelconque a l’aide des coordonnees d’espace et de temps :
xα = (ct, x, y, z) (3.16)
Ces quatre nombres 14 peuvent donc etre consideres comme etant les coordonnees du point-evenement
en question dans un systeme de coordonnees bien determine de l’espace-temps, dit de Minkowski.
Ainsi, si l’espace-temps de Minkowski est designe par E4, nous avons les relations :Evenement : point de E4
Observateur : systeme de coordonnees de E4
qui correspondent simplement a l’idee physique selon laquelle l’evenement est absolu 15, tandis
que ses coordonnees sont relatives a un observateur donne.
Nous avons introduit dans (3.16) pour la premiere fois la notation indicielle propre au calcul
tensoriel (qui sera aussi utilisee dans l’etude des espaces plats en coordonnees curvilignes et des
espaces riemanniens (courbes) propres a la relativite generale) : l’indice α – ainsi d’ailleurs que
tout indice grec – prendra les valeurs (0, 1, 2, 3), l’indice ”0” etant conventionnellement associe a
la coordonnee temporelle (x0 = ct), les indices i = 1, 2, 3 correspondant aux coordonnees spatiales
xi (x1 = x, x2 = y, x3 = z). On notera aussi la position superieure (dite contravariante) de l’indice
α, correspondant, suivant la convention adoptee, au caractere vectoriel du quadri-vecteur position
(spatio-temporelle), dont les quatre composantes sont donnees par (3.16).
Si on considere, a present, un evenement E et deux observateurs S et S, la transformation de
Lorentz speciale qui lie les coordonnees respectives xα et xβ (cf. (3.6)) peut s’ecrire sous la forme
14. La coordonnee temporelle t a ete multipliee par la vitesse de la lumiere c afin que les quatre coordonnees
spatio-temporelles aient les memes dimensions physiques.15. Avant la theorie de la relativite, le temps etait considere comme absolu et peut donc etre imagine comme formant
une ”droite” independante de l’observateur. En revanche, l’espace, meme en physique classique, ne possede pas ce
caractere absolu puisque, par exemple, deux evenements non simultanes et colocaux pour un observateur peuvent etre
percus comme se produisant en des endroits distincts par un autre observateur.
158
compacte comme suit :
xα =3∑
β=0
∧αβxβ (3.17)
ou encore, en adoptant la convention de sommation d’Einstein, selon laquelle lorsqu’une expres-
sion contient un indice en position superieure et le meme indice en position inferieure, la som-
mation sur cet indice est sous-entendue sur toutes les valeurs possibles de cet indice (ici, l’indice
β) :
xα = Λαβx
β (3.18)
Les quantites {Λαβ} constituent une collection de 16 nombres qui forment la matrice de transfor-
mation de Lorentz (speciale) qui s’ecrit explicitement sous la forme suivante 16 (cf. (3.6)) :
Λαβ =
γ γβ 0 0
γβ γ 0 0
0 0 1 0
0 0 0 1
(3.19)
avec γ donne par (3.10) et :
β =V
c(3.20)
Dans le cas d’une transformation de Lorentz generale, definie dans la section 3.3, la relation
(3.18) peut etre generalisee et peut s’ecrire
xα = Λαβ x
β +Mα (3.21)
ou la matrice de transformation de Lorentz generale est donnee par l’expression suivante (cf.
(3.9)) :
Λαβ =
γ γ
Vjc
γAikVkc
Aij + (γ − 1)AikVkVjV 2
(3.22)
et le quadri-vecteur constant Mα par
Mα =
(b c
Aikak
)(3.23)
Considerons maintenant deux evenements, E1 et E2 et deux observateurs S et S :
E1 : xα(1), xα(1)
16. Attention a l’utilisation quelque peu ambigue du symbole β pour designer deux choses distinctes (indices et
rapport V/c) !
159
E2 : xα(2), xα(2)
Posons :∆xα = xα(2)− xα(1)
∆xα = xα(2)− xα(1)(3.24)
∆xα et ∆xα sont les composantes du 4-vecteur−−−→E1E2 dans les deux systemes d’axes consideres.
Puisque, compte tenu de (3.21) :
xα(2) = Λαβ x
β(2) +Mα
xα(1) = Λαβ x
β(1) +Mα
il vient, par soustraction
∆xα = Λαβ∆xβ (3.25)
qui n’est autre que la loi de transformation des composantes ∆xα du 4-vecteur dans l’espace de
Minkowski E4. Suivant que l’on considere une transformation de Lorentz speciale ou generale, il
y a lieu d’utiliser dans (3.25) la forme (3.19) ou (3.22) respectivement pour la matrice de Lorentz
Λαβ.
Formons a partir de (3.25) la quantite scalaire ∆s2 definie comme suit :
∆s2 = ηαβ∆xα∆xβ = ηαβΛαµΛβ
ν∆xµ∆xν (3.26)
(avec dans le second membre une quadruple sommation sur les indices α, β, µ et ν) ou ηαβ (α, β =
0, 1, 2, 3) est un symbole de Kronecker generalise, dote des proprietes suivantes :
ηoo = −1
ηoi = 0
ηio = 0
ηij = δij
(3.27)
Dans ce cas, le developpement de l’expression (3.26) de ∆s2 en termes de ∆xα donne le
resultat suivant :
∆s2 = −c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2 (3.28)
De plus, on peut montrer que :
ηαβ Λαµ Λβ
ν ∆xµ∆xν
peut se mettre sous la forme :
−c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2
160
aussi bien dans le cas d’une transformation de Lorentz speciale que generale.
Verifions-le dans le cas de la transformation speciale caracterisee par la matrice de Lorentz
(3.19). On a alors :
ηαβΛαµΛβ
ν∆xµ∆xν = η00Λ0
µΛ0ν∆x
µ∆xν + ηi0ΛiµΛ0
ν∆xµ∆xν
+ η0jΛ0µΛj
ν∆xµ∆xν + ηijΛ
iµΛj
ν∆xµ∆xν
= − [γ2c2(∆t)2 + 2γ2βc∆t∆x+ γ2β2(∆x)2]
+ [γ2β2c2(∆t)2 + 2γ2βc∆t∆x+ γ2(∆x)2]
+ (∆y)2 + (∆z)2
= − c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2
Si ∆xα et ∆xα sont relies par la matrice (3.22), l’invariance du ∆s2 decoule immediatement
du calcul ci-dessus si l’on remarque que les rotations des axes spatiaux ainsi que les translations
des axes spatiaux et temporel qui differencient les transformations de Lorentz generales des trans-
formations speciales laissent invariantes separement les quantites (∆x)2 +(∆y)2 +(∆z)2 et (∆t)2.
Nous avons ainsi mis en evidence l’invariance de la quantite ∆s2 = ηαβ ∆xα∆xβ vis-a-vis
d’une transformation de Lorentz (speciale ou generale), qui se traduit explicitement sous la forme
suivante :
−c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2 = −c2(∆t)2 + (∆x)2 + (∆y)2 + (∆z)2 (3.29)
∆s2 peut etre interprete comme le carre de la distance dans l’espace de Minkowski entre les deux
evenements consideres. Cette forme quadratique generalise l’expression habituelle de la distance
dans l’espace euclidien tridimensionnel entre deux points voisins de coordonnees cartesiennes
respectives (y, y, z) et (x+ ∆x, y + ∆y, z + ∆z) :
∆s2 = δij∆xi∆xj = (∆x)2 + (∆y)2 + (∆z)2 (3.30)
Cette distance n’est autre que la norme du vecteur tridimensionnel ∆~x de composantes (∆x,∆y,∆z).
On sait que cette norme est invariante vis-a-vis d’une translation ou dune rotation de l’espace (une
rotation d’angle θ autour de Oz par exemple, caracterisee par une matrice de transformation ortho-
gonale).
On remarquera dans l’expression (3.28) de la distance quadridimensionnelle ∆s2 dans l’es-
pace de Minkowski la presence du signe moins devant le terme associe a la coordonnee temporelle
xo = ct. Ceci n’est que le reflet du caractere pseudo-euclidien de l’espace de Minkowski (alors que
l’espace tridimensionnel habituel, cadre de la mecanique classique, est euclidien). Ainsi, l’expres-
sion (3.26) du ∆s2 peut etre interpretee comme une pseudo-norme du quadri-vecteur−−−→E1E2 dans
l’espace pseudo-euclidien de Minkowski, le “symbole de Kronecker generalise” ηαβ remplacant
161
le symbole de Kronecker δij . Du point de vue geometrique fondamental, ηαβ et δij peuvent etre
d’ailleurs consideres comme les composantes du tenseur metrique defini respectivement sur l’es-
pace de Minkowski et sur l’espace euclidien.
Puisque le ∆s2 de deux evenements ne depend que de ces deux evenements et non pas de l’ob-
servateur, il est raisonnable de classer les paires d’evenements de la facon suivante :
1) ∆s2 < 0 (intervalle ∆s temporel)Lorsque le ∆s2 de deux evenements E1 et E2 est negatif, on dit que ces deux evenements
definissent un intervalle temporel ou encore que le quadri-vecteur−−−→E1E2 est du genre ”temps”.
Il est evident que deux evenements colocaux pour un observateur definissent toujours un in-
tervalle temporel. Reciproquement, on montre que deux evenements qui definissent un intervalle
temporel sont toujours colocaux pour un (et un seul) observateur d’inertie. Considerons en effet un
systeme d’inertie S tel que :
∆s2 = |∆~r|2 − c2∆t2 < 0 (3.31)
Cherchons alors un systeme d’inertie S (c’est-a-dire une vitesse ~V ) pour que l’on ait ∆~r = 0.
C’est-a-dire, d’apres la transformation de Lorentz ecrite sous forme vectorielle (cf. (3.8)) :
∆~r +
[(γ − 1)
~V ·∆~rV 2
+ γ∆t
]~V = 0
Pour etablir la reciproque enoncee ci-dessus, il faut et il suffit de montrer que cette derniere
equation possede une solution acceptable pour ~V , c’est-a-dire telle que V < c. Or la solution
de cette equation est :
~V = −∆~r
∆t(3.32)
et son module est bien inferieur a c puisque :
V 2 =|∆~r|2
∆t2< c2
en vertu de l’hypothese ∆s2 < 0.
On peut aussi prouver que si deux evenements sont en relation temporelle (∆s2 < 0), le signe
de ∆t est invariant (c’est-a-dire invariant de l’observateur). Ceci se demontre en partant de (cf.
(3.8)) :
∆t = γ
[~V ·∆~rc2
+ ∆t
]=
∆t
γ(3.33)
En consequence, etant donne deux evenements dont le ∆s2 est negatif, il est possible de dire
que l’un est anterieur a l’autre de facon absolue, c’est-a-dire quel que soit l’observateur considere :
l’ordre temporel de ces evenements est donc absolu.
162
D’autre part, puisqu’il existe toujours un systeme d’inertie dans lequel deux tels evenements
sont colocaux, on peut dire qu’il existe entre eux une relation causale possible, puisqu’un obser-
vateur (ou une particule) peut effectivement aller de l’un a l’autre sans depasser la vitesse limite c.
Bien entendu, deux evenements en relation causale ont un ∆s2 negatif.
2) ∆s2 = 0 (intervalle ∆s lumineux ou nul)Deux evenements dont le ∆s2 est nul definissent un intervalle lumineux. Dans ce cas, la lumiere
peut aller d’un evenement a l’autre puisqu’elle se propage dans le vide selon un mouvement recti-
ligne et uniforme de vitesse c. Reciproquement, bien sur, si la lumiere peut aller d’un evenement a
l’autre, le ∆s2 de ces evenements est nul.
Par exemple, un atome emet un photon (E1), celui-ci se propage dans le vide et est finalement
absorbe par un autre atome (E2).
3) ∆s2 > 0 (intervalle ∆s spatial)Si ∆s2 > 0, on dit que les evenements forment un intervalle spatial, ou sont en relation spatiale.
Le quadri-vecteur−−−→E1E2 est dit du ”genre espace”.
Deux evenements simultanes dans un certain systeme d’inertie sont evidemment en relation
spatiale. Reciproquement, si deux evenements ont un ∆s2 positif, il existe un systeme d’inertie (en
fait une infinite) dans lequel ces deux evenements sont simultanes.
En effet, soit S un systeme d’inertie tel que :
∆s2 = |∆~r|2 − c2∆t2 > 0
Cherchons alors un autre systeme de reference d’inertie S, defini par une vitesse ~V , tel que
l’on ait ∆t = 0. C’est-a-dire, d’apres la transformation generale de Lorentz (cf. (3.8)) :
∆t = γ
(~V ·∆~rc2
+ ∆t
)= 0
c’est-a-dire~V ·∆~rc · c∆t
= −1
On voit alors facilement que cette relation, consideree comme une equation pour ~V , possede
une infinite de solutions telle que V < c.
Enfin, il est interessant de faire remarquer que l’ordre temporel de deux evenements en relation
spatiale n’est pas absolu et, qu’en consequence, il ne peut jamais exister de relation causale entre
deux tels evenements. En effet, la transformation de Lorentz generale donne
∆t = γ
(∆t−
~V∆~r
c2
)
163
Si S est un systeme tel que ∆t = 0, on trouve que
∆t = −~V∆~r√c2 − V 2
1
c
Comme ∆~r 6= 0, on se convainc facilement qu’en faisant varier ~V , avec V < c, on peut donner
a ∆t n’importe quelle valeur (negative ou positive).
En resume, il est donc tout a fait clair que pour deux evenements E1 et E2, caracterises par
un ∆s2 > 0, aucune observation ni aucune particule ne peut aller de l’un a l’autre, de sorte qu’il
n’existe ici aucune relation causale possible entre les deux evenements en question. Enfin, le signe
de ∆t n’est pas invariant, de sorte qu’il n’existe pas non plus d’ordre temporel absolu entre ces
deux evenements. E1 sera anterieur, simultane ou posterieur a E2, selon l’observateur considere.
Le cone de lumiereEtant donne un evenement bien determineE, il est clair que ce qui precede permet de classer les
autres evenementsE ′ selon la nature de l’intervalleEE ′. Ainsi, nous avons d’abord les evenements
E ′ tels que l’intervalle EE ′ soit lumineux (c’est-a-dire les evenements E ′ a distance nulle de E).
Ces evenements E ′ sont definis par l’equation suivante, quel que soit l’observateur considere :
(x′ − x)2 + (y′ − y)2 + (z′ − z)2 − c2(t′ − t)2 = 0 (3.34)
qui represente dans E4 un cone de sommet E (voir Figure 3.9). On dit qu’il s’agit du cone de
lumiere en E : c’est l’ensemble de tous les evenements qui sont en relation lumineuse avec E.
L’interieur du cone de lumiere en E contient les evenements E ′ qui sont en relation temporelle
avec E. Il se divise evidemment en deux parties : le futur absolu de E et le passe absolu de E.
Enfin l’exterieur du cone en question contient les evenements E ′ qui sont en relation spatiale avec
E (l’ailleurs de E).
Remarquons encore que toute trajectoire corpusculaire passant parE est necessairement conte-
nue dans le cone dans le cas d’une particule materielle et est necessairement une generatrice du
cone dans le cas d’un photon. Le cone de lumiere est donc engendre par l’ensemble de toutes les
trajectoires lumineuses passant par E.
Exercices
1. A partir de la transformation de Lorentz speciale (cf. (3.6)), montrer que les relations de chan-
gement de coordonnees peuvent etre interpretees geometriquement comme un changement d’axes
obliques particulier dans un plan euclidien, suivant le graphique 3.10 (sinα = V/c) : On a en
164
FIGURE 3.9 –
effet :
x = cosαx+ sinαct
ct = sinαx+ cosαct
On remarquera que ces deux systemes d’axes ont les memes bissectrices. Pourquoi est-ce im-
portant ?
2. En vertu de la transformation de Lorentz speciale (cf. (3.6)), la loi de mouvement
x = ±ct+ Cte
entraıne
x = ±ct+ Cte′
Interpreter ce resultat.
165
FIGURE 3.10 –
3. Dessiner sur le graphique precedent le passe et le futur absolu d’un evenement quelconque.
4. Dessiner deux evenements simultanes dans S. Sont-ils en general simultanes dans S ? Comment
peut-on retrouver ce resultat a partir des relations (3.7) ? Ce resultat porte le nom de relativite de
la simultaneite.
5. Toujours en utilisant la transformation de Lorentz speciale, montrer que si deux evenements
sont simultanes pour un observateur S, leur ordre temporel est inverse selon que l’on considere un
observateur S ou un observateur ¯S situe a gauche, ou a droite de S, comme indique sur la figure
3.11.
6. Discuter la dilatation du temps a l’aide de la representation graphique de la transformation de
Lorentz speciale.
7. Enfin, discuter la contraction des longueurs a l’aide de la representation graphique de la trans-
formation speciale de Lorentz.
166
FIGURE 3.11 –
3.6 L’effet Doppler longitudinal
Supposons que O soit une source lumineuse monochromatique et que O soit un recepteur.
Imaginons egalement pour fixer les idees que la source s’eloigne du recepteur (voir Figure 3.12) :
Considerons l’emission par O d’un photon ou d’un flash lumineux en direction de O (evenement
FIGURE 3.12 –
E1) et la reception par O de ce meme flash (evenement E2).
Nous avons le tableau suivant :
S S
E1 x1 = 0 , t1 = t
E2 x2 = 0 , t2 = t
en designant par t l’instant de l’emission (a l’horloge de O) et par t l’instant de la reception (a
l’horloge de O). Notons que t et t concernent ici deux evenements differents.
En utilisant la transformation de Lorentz speciale, il est aise de completer ce tableau et d’obte-
nir :
167
S S
E1 x1 = 0 , t1 = t x1 =V t√
1− V 2
c2
, t1 =t√
1− V 2
c2
E2 x2 =−V t√1− V 2
c2
, t2 =t√
1− V 2
c2
x2 = 0 , t2 = t
Exprimant maintenant que le ∆s2 des deux evenements en question est nul, il vient 17 :
(x2 − x1)2 = c2(t2 − t1)2 (3.35)
ou encore, puisque x1 est nul et x2 negatif :
c(t2 − t1) = −x2
car on doit manifestement avoir t2 > t1. Par suite :
c
t√1− V 2
c2
− t
=V t√
1− V 2
c2
ou encore :
t =
√1 + V
c√1− V
c
t (3.36)
Telle est donc la relation entre l’instant d’emission t lu sur l’horloge de la source et l’instant
de reception t lu sur l’horloge du recepteur, dans le cas d’un flash lumineux se propageant dans le
vide.
Si la source emet une onde lumineuse monochromatique, on aura, considerant deux maxima
successifs :
∆t =
√1 + V
c√1− V
c
∆t ,
ou encore :
τ =
√1 + V
c√1− V
c
τ
17. Nous travaillons ici dans S. Si on travaille dans S, on obtient evidemment le meme resultat final. Par ailleurs, les
deux horloges considerees indiquent 0 lorsqu’elles coıncident. De plus, nous avons suppose que l’emission s’effectuait
apres cette coıncidence. t est donc positif et il en est de meme a fortiori de t.
168
en designant par τ la periode de l’onde mesuree par la source et par τ la periode mesuree par le
recepteur :
τ = ∆t , τ = ∆t
En utilisant les longueurs d’onde au lieu des periodes, cette relation peut encore s’ecrire sous la
forme suivante, puisque λ = cτ et λ = cτ ,∣∣∣∣∣∣∣λ =
√1 + V
c√1− V
c
λ
∣∣∣∣∣∣∣ (3.37)
Il s’agit la de la formule de l’effet Doppler relatif aux ondes lumineuses, ou plus generalement
aux ondes electromagnetiques se propageant dans le vide, dans le cas ou la source et le recepteur
s’eloignent l’un de l’autre :
λ > λ (red-shift) .
On definit, en astrophysique observationnelle, le red-shift z (appele en francais ”decalage vers
le rouge”) d’une galaxie ou d’un quasar, comme etant
z =∆λ
λ=λ− λλ
ou
∆λ = λ− λ
En vertu de (3.37), on a donc
z =
√1 + V
c√1− V
c
− 1
Le quasar le plus distant possede un red-shift z = 6, 28. Dans le cadre de la theorie de la rela-
tivite restreinte (i.e. ne connaissant pas encore lexistence de la theorie de la Relativite Generale),
on conclut donc que ce quasar semble s’eloigner de nous avec une vitesse egale a 96, 3% celle de
la vitesse de la lumiere.
Si la source et le recepteur se rapprochent l’un de l’autre, il est facile de voir que l’on a par
contre : ∣∣∣∣∣∣∣λ =
√1− V
c√1 + V
c
λ
∣∣∣∣∣∣∣ (3.38)
c’est-a-dire :
λ < λ (blue-shift)
169
Lorsque V est beaucoup plus petit que c, ces formules prennent la forme approchee mieux
connue :
λ =
(1± V
c
)λ
que l’on ecrit souvent sous la forme
z =∆λ
λ= ±V
c(3.39)
L’effet Doppler considere ici porte le nom d’effet Doppler longitudinal parce que l’onde lumi-
neuse se propage parallelement a la vitesse relative entre la source et le recepteur. Cet effet Doppler
longitudinal est essentiellement un effet du premier ordre, alors que l’effet Doppler transversal est
du second ordre en V/c (cf. page 182).
La formule relativiste de l’effet Doppler longitudinal :
λ =
√1± V
c√1∓ V
c
λ =
[1± V
c+
1
2
(V
c
)2
+ ...
]λ (3.40)
a ete verifiee experimentalement, jusqu’au second ordre inclus, par Ives et Stilwell en 1941.
Exercices
1. Effet Doppler longitudinalEtudier l’effet Doppler longitudinal a l’aide de la representation graphique de la transformation
de Lorentz speciale. On considere sur la trajectoire de la source dans l’espace-temps (ensemble de
tous les evenements loacalises a la source) les emissions de deux maxima successifs. Chacun de
ces maxima se propageant vers le recepteur a la vitesse de la lumiere, il est facile d’obtenir les
receptions de ces deux maxima par le recepteur. En exprimant que λ = cτ et λ = cτ ont la meme
projection sur l’une des deux bissectrices, on obtient la formule cherchee avec un peu de trigo-
nometrie.
2. Expansion superluminique du quasar 3C273
Les sources d’energie les plus puissantes que nous connaissions dans l’Univers sont associees
avec des astres d’apparence stellaire, appeles ”quasars”. Typiquement, ceux-ci sont situes a des dis-
tances de plusieurs milliards d’annees lumiere et, malgre leurs tres petites dimensions par rapport
a celles des galaxies, les quasars possedent une luminosite au moins 100 fois plus elevee que celle
de notre propre Galaxie, la Voie Lactee, composee elle-meme de plus de 100 milliards d’etoiles.
Vu leur distance cosmologique et leur tres grande luminosite, les quasars constituent des phares de
tout premier choix pour etudier le contenu materiel et la structure de l’Univers.
170
Un des problemes rencontres lors de l’etude des quasars provient du fait que certains d’entre
eux sont formes de plusieurs composantes distinctes qui semblent, notamment dans le domaine
radio, se separer les unes des autres avec des vitesses relatives superieures a la vitesse de la lumiere.
On parle alors de vitesses superluminiques (cf. figure 3.13).
FIGURE 3.13 –
Legende de la figure 3.13 : Contours representant des intensites egales d’emission radio en pro-
venance du quasar 3C273. On voit a partir de ces graphes une composante brillante (a droite) du
quasar qui s’eloigne avec une vitesse superluminique. L’epoque de chaque observation est indiquee
en annee decimale sur les differents graphes. Chaque division sur l’echelle horizontale correspond
a 2 milli-secondes d’arc (1 milli-seconde d’arc = 10−3/3600 degres = 4, 8510−9 radians). Figure
de Pearson et al., 1981, Nature, Vol. 290, pp. 365-368.
Une des theories qui permet de comprendre ces observations suppose que le quasar emet un jet
de matiere (plasma) avec une vitesse relativiste le long d’une direction proche de la ligne de visee.
Le mouvement et l’emission de lumiere des composantes formant le jet permettent de comprendre
la vitesse apparente superluminique observee.
La figure 3.14 illustre la propagation de la lumiere vers un observateur distant, emise a deux
instants differents, a partir d’une meme structure du jet qui se propage avec une vitesse v < c.
L’intervalle de temps entre les deux emissions d’un flash illustrees dans la figure 3.14 vaut ∆t. Le
temps est mesure localement, pres de la structure du quasar, au moyen d’un systeme de reference
(coordonnees et temps) attache a la Terre. Evidemment, a cause du trop grand eloignement du
quasar, nous n’avons aucune chance de pouvoir mesurer directement ∆t. La seule chose qu’il nous
171
est possible de mesurer est l’intervalle de temps ∆trec entre les moment de reception des deux
flashes sur Terre. A partir de la figure 3.14, on trouve facilement que
∆trec = ∆t · (1− v
ccos θ)
ou θ represente l’angle entre la direction du jet et celle de l’observateur.
FIGURE 3.14 –
(Legende : figure de gauche) : Emission d’un premier flash lumineux vers la Terre a partir d’une
composante brillante du quasar qui se deplace suivant une direction faisant un angle θ par rapport
a celle de l’observateur terrestre, avec une vitesse v relativiste. (Legende : Figure de droite) : La
meme structure du quasar emet un second flash lumineux apres un intervalle de temps ∆t. Figure
adaptee a partir de l’article de Gabuzda, 1987, American Journal of Physics, Vol. 55, pp. 214-215.
Un deuxieme inconvenient d’observer les structures radio d’un quasar a partir de la Terre pro-
vient du fait que nous n’en voyons qu’une projection sur le plan du ciel. Il nous est en effet im-
possible de mesurer les mouvements le long de la ligne de visee. Nous sommes donc seulement
172
capables de mesurer leur mouvement propre, c’est-a-dire la projection des mouvements vrais pro-
jetes sur le plan du ciel. L’expression de ce mouvement propre ∆xrec detecte sur un recepteur
d’images vaut tout simplement (cf. figure precedente)
∆xrec = v∆t sin θ
La vitesse apparente vrecx avec laquelle nous mesurons le deplacement de la structure du quasar
sur le recepteur vaut donc
vrecx =∆xrec
∆trec=
vc
sin θ
1− vc
cos θ
Quelle est la valeur de vrecx lorsque la structure du quasar est emise le long de la ligne de visee
vers la Terre ? Et perpendiculairement a celle-ci ?
Trouver une expression qui donne l’intervalle des angles θ pour lesquels vrecx est superieur a c.
Pour θ = 45 deg, pour quelle vitesse de v obtiendra-t-on vrecx > c ?
Etablir une seconde expression pour l’angle θmax tel que la valeur de vrecx y est maximale.
Montrer que cet angle verifie l’equation cos θmax = v/c. Montrer que pour cette valeur de θmax, la
vitesse apparente maximum de vrecx vaut
vrec,maxx
c=
v/c√1− (v/c)2
Quelle est la valeur apparente maximale de vrecx lorsque v = 0, 99c ?
Sachant que la distance du quasar 3C273 est d’environ 2,6 milliards d’annees lumiere, deduire
a partir des observations radio de 3C273 la vitesse apparente de la structure radio brillante qui se
deplace par rapport au centre de lumiere du quasar 18.
18. Des vitesses superluminiques ont ete mesurees pour les structures radio de plusieurs dizaines de quasars
differents.
173
3.7 La mecanique relativiste du point materiel
Il est evident que l’equation de Newton n’est pas invariante par rapport a la transformation
de Lorentz, a moins d’admettre pour la force ~F une loi de transformation fort peu naturelle, qui
conduirait d’ailleurs a de serieuses difficultes du point de vue de la theorie physique des forces. En
fait, il est bien clair que l’equation de Newton est en harmonie tellement etroite avec la transfor-
mation de Galilee, que l’abandon de cette derniere en relativite restreinte implique necessairement
que l’on repense completement la formulation de la mecanique, et pour commencer, la formulation
de la mecanique d’une particule.
Le probleme consiste donc a generaliser les notions de masse, d’acceleration et de force et a
postuler une equation de mouvement repondant a plusieurs exigences : cette equation doit etre une
equation vectorielle dans E4, de telle sorte que son invariance par rapport aux transformations de
Lorentz soit automatiquement satisfaite ; elle doit se reduire a l’equation de Newton si la vitesse
de la particule consideree est beaucoup plus petite que c, ou encore si c tend formellement vers
l’infini ; elle doit etre telle que la vitesse de la particule ne puisse jamais devenir egale a c, ni a
fortiori plus grande que c ; et enfin elle doit conduire au mouvement rectiligne et uniforme, qui est
bien ”Lorentz-invariant”, lorsque la force s’annule.
La solution de ce probleme s’obtient en fait par une generalisation tout a fait naturelle de
l’equation de Newton 19 :
m0d~v
dt= ~F
en y remplacant chacune des grandeurs classiques m0, t, ~v et ~F par un scalaire ou un vecteur
approprie de E4.
En ce qui concerne m0, aucune modification n’est necessaire puisqu’il s’agit d’une constante
qui est bien sur invariante. Pour des raisons qui deviendront vite evidentes, nous dirons que m0 est
la masse propre de la particule. Il s’agit d’une constante positive que l’on assigne une fois pour
toutes a la particule en question ; c’est donc une propriete intrinseque de la particule.
Considerons maintenant le temps t : il s’agit d’un scalaire de E3, mais non pas d’un scalaire de
E4 puisque t est une coordonnee de l’espace-temps.
Ainsi la derivee d’un vecteur de E4 par rapport a t n’est evidemment pas un vecteur de E4, de
sorte que l’operation :d
dt
19. La masse de la particule est ici designee par mo pour des raisons de commodite, que l’on comprendra par la
suite.
174
est ici tout a fait inadequate. Il est cependant facile de lui substituer l’operation :
d
dτ
qui ne souffre pas de cet inconvenient, en introduisant le temps propre τ de la particule consideree,
qui n’est rien d’autre en fait (a la constante c pres) que la longueur de la trajectoire de la particule
dans E4, relativement a la metrique de Minkowski :
ds2 = −c2dt2 + dx2 + dy2 + dz2 . (3.41)
Considerons la trajectoire de la particule dans E4 : c’est l’ensemble de tous les evenements qui
constituent l’histoire de la particule. Soient deux points infiniment voisins sur cette trajectoire et
leurs coordonnees
xα, xα + dxα
relativement aux axes xα = ct, x, y, z associes a un observateur d’inertie quelconque (voir
Figure 3.15).
FIGURE 3.15 –
On sait que le ds2 entre ces deux evenements, qui est defini par :
ds2 = ηαβdxαdxβ = −c2dt2 + dx2 + dy2 + dz2
est un invariant 20 negatif. En fait, on a :
ds2 = (v2 − c2)dt2 < 0
20. C’est-a-dire que ηαβdxαdxβ a la meme valeur quelles que soient les coordonnees considerees : cette grandeur
ne depend donc que des deux evenements infiniment voisins choisis sur la trajectoire de la particule.
175
ou v designe le module de la vitesse ~v :
v2 =
(dx
dt
)2
+
(dy
dt
)2
+
(dz
dt
)2
Il en resulte que la grandeur reelle :
dτ =
√1− v2
c2dt (3.42)
est egalement invariante dans E4. Cette grandeur dτ est l’intervalle de temps propre de la parti-
cule entre les deux evenements consideres. L’intervalle de temps propre de la particule entre deux
evenements quelconques E1 et E2 situes sur sa trajectoire de E4 est evidemment :
∆τ =
∫ t2
t1
√1− v2
c2dt (3.43)
v etant une fonction connue de t. Il s’agit essentiellement (a un facteur c pres) de la longueur de
l’arc E1E2 dans la geometrie pseudo-euclidienne de Minkowski (voir Figure 3.16).
FIGURE 3.16 –
Quant au temps propre de la particule, il est defini a une constante additive pres, par la primi-
tive :
τ =
∫ √1− v2
c2dt (3.44)
Si on fixe la constante de primitivation, c’est-a-dire si on choisit le point de la trajectoire a partir
duquel on compte τ , la fonction :
τ = τ(t)
est parfaitement determinee et on peut ecrire les equations de la trajectoire sous la forme pa-
rametrique 21 :
xα = xα(τ) . (3.45)
21. Dans la representation ordinaire :ct = ct
x = x(t)
y = y(t)
z = z(t)
xα = xα(t) .
176
et definir :
uα =dxα
c dτ(3.46)
qui est manifestement un vecteur de E4. Ce vecteur est naturellement tangent a la trajectoire
consideree, au point τ en question (voir Figure 3.17).
FIGURE 3.17 –
De plus 22, on a :
ηαβuαuβ = ηαβ
dxα
c dτ
dxβ
c dτ
c’est-a-dire :
ηαβuαuβ = −1 (3.47)
de telle sorte que uα est un quadri-vecteur du genre temps de longueur constante (= 1).
On dit que uα est la quadri-vitesse (unitaire) de la particule, ou encore sa vitesse dans E4.
Compte tenu de :
dτ =
√1− v2
c2dt ,
il est facile de voir que les relations qui existent entre la vitesse dans E4 :
uα =dxα
c dτ
et la vitesse dans E3 :
vi =dxi
dt
De plus, en vertu de la definition du temps propre :
τ = τ(t) , t = t(τ) .
Par suite :
xα = xα(τ) .
22.
ds2 = ηαβdxαdxβ = −c2dτ2 .
177
sont simplement :
uo =1√
1− v2
c2
, ui =vi/c√1− v2
c2
que nous ecrirons sous la forme :
uα =(1, vi/c)√
1− v2
c2
(3.48)
De ce qui precede, il resulte que la generalisation la plus simple de l’equation de Newton
consiste a considerer le vecteur de E4
m0cduα
dτ
et a l’egaler a une certaine force quadridimensionnelle Kα. Nous sommes ainsi tout naturellement
amenes a postuler l’equation de mouvement :
m0cduα
dτ= Kα (3.49)
ou Kα designe un vecteur de E4 qui represente la force reelle a laquelle la particule en ques-
tion est soumise. Bien entendu, la possibilite de representer les forces reelles par des vecteurs de
E4 doit etre examinee dans le cadre de la theorie physique des forces (dans le cas de la force
electromagnetique agissant sur une particule chargee, cette possibilite se presente d’elle-meme,
tout naturellement). On a, de plus,
ηαβKαuβ = 0 (3.50)
qui est une consequence de l’equation de mouvement, puisque le vecteur uα est de longueur
constante. On a, en effet :
ηαβKαuβ = ηαβmoc
duα
dτuβ
=m0 c
2
d
dτ(nαβu
αuβ) = 0
En resume, toute force reelle est representee en relativite restreinte a l’aide d’un vecteur Kα
de E4, identiquement orthogonal a la vitesse uα de la particule, et l’equation fondamentale de la
mecanique relativiste s’ecrit sous la forme (avec 3 equations independantes)
m0cduα
dτ= Kα , avec uα =
dxα
c dτ
Cette equation fondamentale est evidemment ”Lorentz-invariante”, puisqu’il s’agit d’une equation
vectorielle dans E4. De plus, lorsque la force s’annule on a bien un mouvement rectiligne et uni-
forme. En effet, on a alors :
uα = constante
178
c’est-a-dire :vi/c√1− v2
c2
= constante ,1√
1− v2
c2
= constante ;
ou encore :
vi = constante .
Considerons maintenant les trois dernieres equations :
m0cdui
dτ= Ki (3.51)
Elles peuvent encore se mettre sous la forme :
d
dt(mvi) = F i (3.52)
si on pose :
m =m0√
1− v2
c2
(3.53)
F i =
√1− v2
c2Ki . (3.54)
La grandeur m s’appelle la masse relative de la particule (elle est relative au systeme d’inertie
considere) : elle varie en general avec le temps puisqu’elle depend de la vitesse v. Enfin, les F i
definissent un vecteur de E3, que l’on appellera la force tridimensionnelle.
L’equationd
dt(mvi) = F i
peut naturellement s’ecrire sous la forme vectorielle dans E3 :
ddt
(m~v) = ~F (3.55)
qui rappelle tres fortement l’equation de Newton. Ici cependant, m est en general variable et ne
peut donc sortir de la derivee.
Cette derniere equation montre que l’equation de Newton est bien obtenue comme cas limite
de l’equation de mouvement relativiste lorsque v est negligeable par rapport a c. Si v n’est pas
negligeable par rapport a c, la masse relative m peut devenir par contre appreciablement plus
grande que la masse propre m0.
En fait, si v tend vers c, m tend vers l’infini, ce qui implique que la particule ne peut jamais
atteindre la vitesse c puisque son inertie grandit sans cesse au fur et a mesure que sa vitesse se
rapproche de c.
179
La grandeur
pα = m0cuα (3.56)
est l’impulsion de la particule dans E4 et la grandeur :
pi = m0cui = mvi (3.57)
son impulsion dans E3. On a donc
~p = m~v (3.58)
et bien entendu :d
dt~p = ~F . (3.59)
Considerons maintenant la premiere equation fondamentale :
m0cdu0
dτ= K0 (3.60)
que l’on sait d’ailleurs n’etre pas independante des trois autres. Elle s’ecrit encore :
d
dt(mc) =
√1− v2
c2K0 (3.61)
ou encore 23
d
dt(m c2) = ~F · ~v (3.62)
Par analogie avec l’equation classique de conservation de l’energie, nous sommes donc amenes
a definir l’energie cinetique de la particule par :
T = mc2 −m0c2 (3.63)
ce qui permet d’ecrire la relation precedente sous la forme :
dT
dt= ~F · ~v (3.64)
qui est exactement la forme classique 24.
23.
ηαβKαuβ = δijK
iuj −K0u0 = 0
d’ou :
K0 =δijK
iuj
u0=
1
c
~F · ~v√1− v2
c2
compte tenu de (3.48) et (3.54).24. Il est clair que l’equation essentielle est
m0duαdτ
= Kα
180
En vertu de la definition de l’energie cinetique T , on a evidemment
mc2 = m0c2 + T (3.65)
ce qui conduit a considerer mc2 comme etant l’energie totale de la particule, formee de deux
termes : une energie de masse propre et une energie cinetique.
D’autre part, si l’expression :
T = (m−m0) c2 =
1√1− v2
c2
− 1
m0c2
est developpee en serie des puissances dev
c, il vient :
T =1
2m0v
2
[1 +
3
4
v2
c2+ ...
](3.66)
de sorte que nous retrouvons l’expression classique en premiere approximation.
Remarquons encore pour terminer que l’on a
pα = m0cuα =
(1
cmc2,mvi
)(3.67)
ce qui justifie le nom de vecteur energie-impulsion donne a ce quadri-vecteur pα.
Une relation interessante lie l’impulsion ~p = m~v et l’energie totale mc2 ; elle s’ecrit comme
suit :
m2c4 = m20c
4 + p2c2 (3.68)
En effet, on a, vu (3.47), (3.48) et (3.56) :
ηαβpαpβ = m2
0c2 ηαβu
αuβ = −m20c
2
= −(p0)2 + δijpipj
= −m2c2 + p2
d’ou (3.68).
avec Kαuα = 0. Les formes plus conventionnelles
d(m~v)
dt= ~F
dT
dt= ~F · ~v
sont evidemment correctes, mais dans un certain sens, secondaires.
181
Considerons finalement le cas important du photon. On a toujours dans ce cas : v = c et, par
suite :
m0 = 0 (3.69)
en vertu de (3.53).
La masse propre du photon est donc nulle et la masse relative indeterminee. La determination se
fait en mecanique quantique, en recourant au dualisme onde-corpuscule et au postulat d’Einstein :
mc2 = hν (3.70)
La relation entre l’impulsion et l’energie d’un photon est donc :
p = mc =hν
c(3.71)
ou h designe la constante de Planck et ν la frequence de l’onde electromagnetique a laquelle le
photon appartient. Cette relation decoule de (3.68) adaptee au cas du photon (m0 = 0) et de (3.70).
Le quadri-vecteur energie-impulsion du photon a donc pour composantes :
pα = (hν
c,hν
cli) (3.72)
ou les li representent les composantes d’un vecteur unitaire ~l (δij lilj = 1) pointant dans la direc-
tion de propagation du photon.
3.7 Exercices
1. L’effet Doppler general
Etudier l’effet Doppler dans le cas ou le recepteur est fixe en O dans un systeme d’inertie et
ou la source lumineuse S est animee par rapport a ce systeme d’un mouvement quelconque (voir
Figure 3.18).
Considerons l’emission par S d’un flash lumineux : evenement E1, et la reception par O de ce
flash : evenement E2. Si x(t), y(t) et z(t) definissent le mouvement de S, on a
E1 : x(t1), y(t1), z(t1), t1; E2, 0, 0, 0, t2
Par suite, puisque le ∆s2 de ces deux evenements est nul :
t2 = t1 +r(t1)
c
avec ~r(t) le vecteur ayant pour composantes (x(t), y(t), z(t)).
182
FIGURE 3.18 –
Si on considere l’emission par la source monochromatique de deux maxima successifs en t1 et
t1 +dt1 et la reception de ces maxima par l’observateur en t2 et t2 +dt2, on a donc en differentiant
l’equation ci-dessus 25
dt2 = dt1 +1
c(~r · ~vr
)t1dt1
D’autrepart, l’intervalle de temps propre de la source entre les deux emissions en question est
dτ1 = (
√1− v2
c2)t1dt1
et l’intervalle de temps propre de l’observateur entre les deux receptions
dτ2 = dt2
Par suitedτ2
dτ1
=
1 + vrc√
1− v2
c2
t1
en posant
vr =~V · ~rr
= vitesse radiale de la source.
Maisdτ2
dτ1
=τ
τ0
=λ
λ0
25. dt1 est assimile a un infiniment petit.
183
D’ou la formule relativiste de l’effet Doppler
λ
λ0
=
1 + vrc√
1− v2
c2
instant d′emission
Discuter a partir de cette formule l’effet Doppler longitudinal et l’effet Doppler transversal.
184
2. Formule de l’aberration relativiste
En partant de la loi de composition des vitesses, demontrer la formule relativiste de l’aberration
(voir figure 3.19)
sin θ =
Vc− (1−
√1− V 2
c2) cosα
1− Vc
cosαsinα
qui s’ecrit encore
sin θ =V
csinα(1 +
V
2ccosα)+
FIGURE 3.19 –
~v et ~v sont les vitesses d’un photon par rapport a S et S, respectivement.
185