Transformations de Lorentz
- Cet article présente les transformations de Lorentz sous un aspect technique. Le lecteur désireux d'obtenir des informations physiques plus générales à ce sujet pourra se référer à l'article Relativité restreinte.

Les transformations de Lorentz sont des transformations linéaires des coordonnées d'un point de l'espace-temps de Minkowski à quatre dimensions. En relativité restreinte, elles correspondent aux lois de changement de référentiel galiléen pour lesquelles les équations de la physique sont préservées, et pour lesquelles la vitesse de la lumière demeure identique dans tous les référentiels galiléens. Elles sont parfois considérées comme l'équivalent relativiste des transformations de Galilée de la mécanique classique.
La forme la plus courante est :
Où (t, x, y, z) et (t′, x′, y′, z′) représentent les coordonnées d'un événement dans deux référentiels inertiels dont la vitesse relative est parallèle à l'axe des , est la vitesse de la lumière, et le facteur de Lorentz est .
Le terme « transformations de Lorentz » peut faire référence aux changements de coordonnées présentés ci-dessus, parfois nommés transformations de Lorentz spéciales ou boost de Lorentz, ou bien à un ensemble plus vaste nommé groupe de Lorentz. Ce groupe est constitué de l'ensemble des transformations linéaires compatibles avec les postulats de la relativité restreinte, c'est-à-dire celles qui laissent invariante la pseudo-norme de l'espace de Minkowski. Le groupe de Lorentz inclut non seulement les boosts de Lorentz pour toute direction arbitraire de l'espace, mais également les pivotements du repère d'espace, nommés rotations statiques[1] de l'espace. Dans le cadre des théories quantiques relativistes et de la description des particules élémentaires, les transformations qui renversent le sens du temps et l'orientation du repère d'espace sont également admises, bien qu'elles puissent sembler dénuées de sens en relativité restreinte. Le groupe de Lorentz est lui-même un sous-groupe du groupe de Poincaré qui étend la définition précédente aux transformations affines, sans se limiter aux transformations linéaires. Le groupe de Poincaré permet ainsi de représenter l'ensemble des changements de repère autorisés en relativité restreinte, y compris ceux impliquant un décalage de l'origine du repère d'espace-temps.
L'éponyme[2] des transformations est Hendrik Lorentz (-). Elles sont ainsi désignées à la suite de Henri Poincaré (-)[3].
Dans l'introduction de la publication « Deux Mémoires de Henri Poincaré sur la physique mathématique »[4], Hendrik Lorentz précise que c'est pour faire en sorte que les équations de Maxwell s'écrivent à l'identique dans tout référentiel galiléen que Henri Poincaré a introduit mathématiquement cette loi[5], en la baptisant du nom de Lorentz. Ce dernier en avait donné une version qu'il a, plus tard, jugée imparfaite[6],[7].

Présentations les plus courantes
[modifier | modifier le code]On considère deux référentiels galiléens et en translation rectiligne uniforme l'un par rapport à l'autre, tels que se déplace à la vitesse par rapport à suivant la direction de l'axe des . On note respectivement et les trois coordonnées spatiales et le temps permettant de repérer un même événement observé depuis chacun de ces référentiels.
Les transformations de Lorentz entre ces deux référentiels sont alors :
Transformation de Lorentz (direction )
|
avec et .
Le paramètre est constant pour une transformation donnée. C'est une grandeur algébrique, positive ou négative, dont la valeur absolue ne peut être égale ou supérieure à : (un déplacement dans le sens positif de l'axe des est compté positivement). Seules les vitesses subluminiques sont ainsi autorisées, et les valeurs possibles pour et sont donc : et .
Les transformations ne sont pas définies si est en dehors de ces limites. En effet, prend une valeur infinie pour et devient un nombre complexe pour . Les coordonnées de temps et d'espace étant des grandeurs mesurables, leur valeur est nécessairement décrite par un nombre réel.
Par ailleurs, en vertu du principe de relativité, aucun référentiel galiléen n'est privilégié par rapport à un autre. Par conséquent, les transformations pour passer de à doivent être de la même forme que celles permettant de passer de à . La seule asymétrie réside dans le fait que se déplace à la vitesse par rapport à . Les transformations inverses s'écrivent ainsi :
Transformation de Lorentz inverse (direction )
|
Les transformations de Lorentz sont ici présentées comme des transformations passives des coordonnées ; autrement dit, on compare la manière dont un même événement est observé depuis deux référentiels différents. Un autre point de vue consiste à les envisager comme des transformations actives qui n'affectent pas le référentiel mais le système physique lui-même. Les nouvelles coordonnées décrivent alors le phénomène tel qu'il serait observé si l'ensemble du système se trouvait embarqué dans un mouvement rectiligne uniforme à la vitesse suivant l'axe des dans ce même référentiel.
- Formes alternatives
- En utilisant , on obtient une écriture plus symétrique des transformations[8] :
- Pour un doublet d'événements, une forme portant sur les différences de coordonnées peut apparaître comme plus intéressante, car ce sont bien des longueurs et des intervalles de temps qui sont mesurés expérimentalement ou qui présentent un intérêt sur le plan physique. En notant et les différences de coordonnées entre deux événements observées depuis chaque référentiel, la linéarité des transformations de Lorentz entraîne[9] :
- En théorie quantique relativiste, l'inversion temporelle T et l'inversion spatiale P sont également admises. Les transformations de Lorentz qui laissent les équations de la physique invariantes (en l'absence de charge électrique) sont alors :
- où les indiquent s'il y a un changement d'orientation temporelle et/ou spatiale.
- Plus généralement, toute transformation utilisée en physique quantique est de la forme , avec une transformation du groupe de Lorentz de la relativité restreinte (orthochrone et propre) et . Le groupe des transformations propres et orthochrones étant connexe, cette décomposition indique que le groupe de Lorentz est formé de quatre composantes connexes.
Présentation sous forme matricielle
[modifier | modifier le code]Sous forme matricielle, les transformations de Lorentz s'écrivent :
où la matrice notée satisfait les propriétés attendues suivantes :
- , ce qui signifie que la transformation préserve l'orientation de l'espace ;
- , où est la métrique de Minkowski , ce qui signifie que la matrice est pseudo-orthogonale et préserve la pseudo-norme de l'espace de Minkowski.
La transformation inverse est donnée par :
Cette écriture sous forme de matrice 4×4 correspond à la représentation standard du groupe de Lorentz, notée (½,½). Les objets qui se transforment sous cette représentation sont des quadrivecteurs (ici, le quadrivecteur temps-position). D'autres représentations matricielles sont cependant possibles et permettent d'appliquer les transformations de Lorentz à des objets de nature différente (ex : champ électromagnétique, bispineurs de Dirac…).
Présentation comme rotation hyperbolique
[modifier | modifier le code]Des définitions et il découle .
L'analogie avec la relation de trigonométrie hyperbolique permet de définir la rapidité en posant :
- et avec .
Toute transformation de Lorentz spéciale peut ainsi s'écrire :
Et la forme inverse :
La ressemblance avec une matrice de rotation dans l'espace ordinaire amène à voir toute transformation de Lorentz spéciale comme une rotation hyperbolique d'angle dans l'espace-temps de Minkowski (où est la rapidité). Cette « rotation » présente cependant la particularité d'affecter également la coordonnée temporelle. Le caractère pseudo-orthogonal des matrices de rotation met en évidence que ces transformations sont bien des isométries de l'espace de Minkowski.
Présentation sous forme diagonalisée
[modifier | modifier le code]Avec les définitions et propriétés des fonctions de la trigonométrie hyperbolique, on obtient une présentation un peu différente des transformations de Lorentz :
Soit, sous forme matricielle :
C'est une forme diagonalisée avec des choix de repères dont deux axes forment l'intersection du cône de lumière avec le plan (Oxt), ou (Ox't') pour l'autre repère, et qui sont impossibles à matérialiser dans l'espace physique à trois dimensions.
Présentation pour une direction quelconque
[modifier | modifier le code]Les transformations de Lorentz peuvent être généralisées à une direction quelconque de l'espace. Pour deux repères galiléens en translation rectiligne uniforme l'un par rapport à l'autre, tels que le mouvement relatif de par rapport à soit décrit par un vecteur vitesse et tels que les origines des deux repères soient confondues à , les transformations s'écrivent sous forme vectorielle :
Transformation de Lorentz (direction v quelconque)
|
où et où et désignent les coordonnées spatiales observées depuis chaque référentiel. Ces formules doivent naturellement demeurer valables dans tous les référentiels inertiels. Le mouvement relatif de par rapport à étant décrit par le vecteur , la transformation inverse s'écrit par conséquent :
Transformation de Lorentz inverse (direction –v quelconque)
|
En écriture matricielle, on obtient[10] :
avec :
Présentation pour d'autres grandeurs
[modifier | modifier le code]Quadrivecteurs
[modifier | modifier le code]Bien que les transformations de Lorentz soient initialement présentées comme des changements de coordonnées de temps et d'espace, elles s'appliquent de manière plus générale à toute quantité physique pouvant être décrite par un quadrivecteur (un quadrivecteur étant par définition un vecteur de dimension quatre dont les composantes se transforment de la même manière que les coordonnées de temps et d'espace). Lors d'un changement de coordonnées, un quadrivecteur est donc transformé en par la relation matricielle linéaire :
où est une transformation de Lorentz exprimée en représentation standard par une matrice 4×4. Par ailleurs, en posant , avec , la pseudo-norme de tout quadrivecteur est donnée par et satisfait une relation de la forme :
indiquant que la norme du quadrivecteur est un invariant relativiste.
Quadrivecteur | A | Z | X |
---|---|---|---|
Quadrivecteur position | Temps | Vecteur position | |
Quadrivecteur impulsion | Energie | Vecteur quantité de mouvement | |
Quadrivecteur vitesse[11] | Vitesse de la lumière | Vecteur vitesse | |
Quadrivecteur force | Puissance mécanique | Vecteur force | |
Quadrivecteur potentiel | Potentiel électrique | Potentiel vecteur magnétique | |
Quadrivecteur densité de courant | Densité de charges électriques | Vecteur densité de courant | |
Quadrivecteur d'onde | Pulsation | Vecteur d'onde | |
Quadrivecteur spin[12] | - | Spin |
Il existe cependant des grandeurs qui ne peuvent s'écrire sous forme de quadrivecteur. C'est par exemple le cas pour le moment cinétique et également pour le champ électrique et le champ magnétique . Le moment cinétique est par définition et devient après un boost . Concernant les champs et , ils constituent deux aspects complémentaires du champ électromagnétique et ne peuvent donc être transformés de manière séparée. En prenant la force de Lorentz comme définition de ces champs, l'application du principe de covariance aux lois de l'électromagnétisme implique que l'expression doit conserver une forme identique après un changement de référentiel inertiel .
Champ électromagnétique
[modifier | modifier le code]Les formules de transformation des champs et suggèrent que ces deux grandeurs sont couplées en un objet mathématique à 6 composantes : un tenseur de rang 2 antisymétrique, c'est-à-dire un bivecteur. Le tenseur électromagnétique s'écrit sous forme matricielle :
- (Convention de signature (+ − − −))
Les champs obtenus après transformation de Lorentz sont donnés sous forme matricielle par :
ou bien en écriture tensorielle :
Pour un simple boost suivant l'axe , on obtient :
Autres quantités
[modifier | modifier le code]Pour un objet général à composantes, les transformations de Lorentz s'écrivent :
avec la représentation qui à toute transformation associe une matrice . Les différentes représentations du groupe de Lorentz (en) sont construites à partir de l'algèbre de Lie du groupe de Lorentz, par exponentiation de matrice.
Implications physiques
[modifier | modifier le code]Les transformations de Lorentz peuvent être mises en parallèle avec les transformations de Galilée de la mécanique classique :
Transformation de Galilée Transformation de Lorentz
On constate que, contrairement au cas classique, la coordonnée temporelle est désormais affectée par le changement de référentiel, le temps ne pouvant plus être considéré comme absolu en relativité. La notion de simultanéité entre deux événements devient relative, ce qui signifie que deux événements simultanés dans un référentiel ne le sont pas nécessairement dans un autre. Le facteur présent devant les parenthèses entraîne l'apparition de phénomènes tels que la contraction des longueurs et la dilatation des durées[13]. Le renoncement à la conception d'un espace et d'un temps absolus permet de garantir l'invariance de c dans tous les référentiels galiléens, en opposition avec la vision classique qui postulait l'existence d'un éther servant de support mécanique à la propagation des ondes lumineuses.
Limites non relativistes
[modifier | modifier le code]Groupe de Galilée
[modifier | modifier le code]Les formules du groupe de Lorentz peuvent s'approximer dans le cas où la vitesse du corps est petite devant celle de la lumière, ou, ce qui revient au même, en faisant tendre la vitesse de la lumière vers l'infini. En négligeant le terme dans les formules, on retrouve alors le groupe de Galilée qui est le groupe des transformations correspondantes aux changements de référentiel en physique classique.
Groupe de Carroll
[modifier | modifier le code]Le groupe de Carroll est une autre approximation non relativiste des éléments du groupe de Lorentz dans le cas où on s'intéresse aux intervalles grands de genre espace. Cette approximation, découverte par Jean-Marc Lévy-Leblond en 1965, n'a d'intérêt que pédagogique, d'après son découvreur[14].
Différentes méthodes pour trouver les transformations
[modifier | modifier le code]Les transformations de Lorentz peuvent être obtenues sans avoir à postuler l'invariance de la vitesse de la lumière dans le vide[15],[16],[N 1]. Elles se déduisent d'un nombre limité d'hypothèses : l'homogénéité de l'espace-temps[17],[18],[19],[N 2] (ou du temps et de l'espace)[20] ; l'infinité de l'espace-temps[21] ; l'isotropie de l'espace[17],[18],[19],[N 3] ; la structure de groupe[18] des transformations ; et le principe[17],[20] de causalité[18],[19],[N 4]. Il s'agit d'une méthode initiée, dès , par Vladimir Ignatovski (-)[19],[22] et exposée, en , par Jean-Marc Lévy-Leblond[23],[24]. Elle est utilisée afin de mettre en évidence que la constante est une constante de structure de l'espace-temps[17],[N 5].
Ci-dessous, une méthode ne faisant pas appel à l'invariance de la vitesse de la lumière dans le vide. [26]
Contexte
- Soient deux référentiels inertiels R (Fig 1, en bleu) et R' (en rouge).
- On fait les hypothèses suivantes :
- les axes de R et R' sont parallèles entre eux et orientés dans le même sens ;
- R' se déplace à vitesse constante par rapport à R, le long de l'axe des x.
- à l'origine de ces référentiels, deux observateurs O et O' sont dotés d'instruments de mesure des distances et du temps identiques.
- au temps 0, les référentiels coïncident

- Le but est de trouver les formules permettant de calculer les coordonnées dans R' d'un événement, sur base des coordonnées dans R, sans prendre comme hypothèse l'invariance de la vitesse de la lumière dans le vide.
- Dans un premier temps, on ne s'intéresse qu'aux événements survenus sur l'axe des X. Les coordonnées et sont omises.
- Au point M se produit un événement dont les coordonnées mesurées dans R et R' sont respectivement
- et
- Soit la mesure de la vitesse de O' par l'observateur O.
- Il faut donc trouver les paramètres tels que
-
(1)
-
Détermination de et
- Par symétrie, la vitesse de O mesurée par O' est .
- Le mouvement de O dans R' est donné par :
- On a et et donc :
-
(2)
-
- Le mouvement de O' dans R est donné par :
- On a et donc :
-
(3)
-
-
(4)
-
Signe de et
- Dans les mêmes hypothèses que pour R', on considère un référentiel R" se déplaçant à une vitesse constante par rapport à R (à l'exact opposé du référentiel R').
- Egalement, on considère un point M* à l'exact opposé de M, où se produit au temps t (dans R) un événement dont les coordonnées mesurées dans R et R" sont par symétrie respectivement
- et

- D'après (4)
-
(5)
-
- Appliqué au référentiel R", (4) donne :
-
(6)
-
- et donc
- qui donne :
-
(7)
-
-
(8)
-
- Egalement, d'après (5), lorsque x=0, .
- Dans notre exemple (Fig 1), lorsque t>0, étant positif, x' ne peut être que négatif, et inversement.
- Il s'en suit que
-
(9)
-
-
(10)
-
Détermination de
- Dans les mêmes hypothèses que pour R', on considère le référentiel R" se déplaçant avec une vitesse constante par rapport à R.

- Au point M se produit un événement dont les coordonnées mesurées dans R, R' et R" sont respectivement
- ,
- Comme R" se déplace à une vitesse constante par rapport à R, les coordonnées de l'événement sont liées par une relation de type (4) :
-
(11)
-
- Egalement, R" se déplace à une vitesse constante par rapport à R', lequel se déplace à une vitesse constante par rapport à R.
- On peut écrire :
- Et tenant compte de (4) :
- Ce qui donne :
-
(12)
-
- D'après (11), les éléments de la diagonale principale doivent être égaux, donc :
- En simplifiant, on obtient :
- Comme v et w' sont arbitraires, on peut en déduire que le rapport
- est une constante () et ne dépend pas de la vitesse de déplacement des référentiels, ce qui implique
-
(13)
-
- On peut réécrire (4) comme :
- En mettant en évidence et en le renommant
-
(14)
-
Composition des vitesses - détermination de
- Supposons dans la Fig 1 qu'il y ait une particule située en M, animée d'une vitesse mesurée dans R et dans R'.
- Connaissant , sachant que R s'éloigne de R' avec une vitesse et que par (8), , on a :
- De même, on a
- Ce qui conduit à :
- A la limite, on obtient une loi relativiste de composition des vitesses :
-
(15)
-
- Supposons que . Dans le cas de la fig 1 (), d'après (15), on peut toujours trouver un assez grand tel que , ce qui est absurde.
- ne peut donc être que négatif.
- Du point de vue des unités, l'équation (15) implique que doit également avoir la dimension de l'inverse du carré d'une vitesse.
- Il existe donc une vitesse notée c telle que .
- La loi (15) relativiste de composition des vitesses devient :
-
(16)
-
- Et la loi (14) devient
-
(17)
-
Détermination de
- L'inversion de (17) donne :
-
(18)
-
- D'autre part, le référentiel R se déplaçant avec une vitesse -v par rapport à l'observateur O', étant donné que (8) :
-
(19)
-
- Comme (9),
- et l'équation (17) devient :
-
(20)
-
Note finale
- Considérant la loi (16) de composition des vitesses, si ,
- Ce qui implique que .
- Non seulement est une constante construite par ce seul raisonnement, mais c'est la seule vitesse invariante dans tous les référentiels inertiels et correspond donc à la vitesse de la lumière dans le vide, réputée également invariante ...
Il existe d'autres méthodes permettant d'obtenir les transformations de Lorentz :
- Pour la relativité restreinte, Einstein a initié une méthode[27] :
- À partir du principe de relativité et de l'invariance de la vitesse de la lumière par changement de référentiel, de l'homogénéité et de l'isotropie supposées de l'espace, et à l'aide d'une représentation géométrique d'une situation idéale où deux référentiels inertiels permettent de voir, mesurer les longueurs, et chronométrer le temps d'un référentiel à l'autre, on démontre les différentes formules par un système d'équations linéaires dont il faut trouver les coefficients. Les transformations non physiques sont parfois écartées sans détail par le choix de la solution positive dans une équation du second degré, choix dû à l'hypothèse physique de l'orientation des repères par une règle telle que celle de la main droite, illustrée par la représentation géométrique accompagnant le raisonnement[28].
- En physique quantique relativiste, comme en théorie quantique des champs, les transformations utilisées sont définies comme les symétries de l'espace de Minkowski qui laissent inchangées les équations (en l'absence de charge électrique). Cela revient à déterminer les transformations linéaires laissant inchangé l'intervalle d'espace-temps : c'est une définition mathématique pour laquelle les changements de référentiel pour des observateurs ne sont que certaines de ces transformations et qui permet de les trouver toutes.
Cette méthode est aussi utilisée dans certains manuels de relativité restreinte, après avoir démontré que l'invariance de l'intervalle d'espace-temps par changement de référentiel découle directement des deux axiomes de la relativité restreinte, et en éliminant les transformations qui ne respectent pas la convention d'orientation pour les repères tridimensionnels (règle de la main droite, en général) et d'orientation de l'axe du temps vers le futur ; élimination faite de diverses manières, parfois marquées du sceau de l'évidence[29], et parfois plus justifiées[30].
- On peut aussi retrouver ces transformations en cherchant les applications linéaires de l'espace-temps à quatre dimensions, mais a priori sans métrique, conservant la forme des équations de Maxwell[31].
La méthode géométrique[32]
[modifier | modifier le code]On suppose que l'espace-temps physique est un espace affine où les référentiels, dont seuls sont considérés ceux qui sont inertiels, sont identifiés aux repères affines de cet espace affine. De plus on néglige les translations constantes entre les repères qui ne se manifestent que par des additions de nombres constants aux coordonnées. Donc, la transformation des coordonnées s'effectue au moyen d'une application linéaire, représentable par une matrice :

Soient deux référentiels et en translation rectiligne l'un par rapport à l'autre sur des axes parallèles, avec une vitesse relative v selon l'axe Ox. Soient les coordonnées spatio-temporelles d'un événement dans le référentiel , et ses coordonnées dans le référentiel . (Pour simplifier les notations, on ne tiendra pas compte dans ce paragraphe des deux autres composantes spatiales y et z).
- Utilisation du principe de relativité :
- Par le principe de relativité, les coefficients de la transformation linéaire ne dépendent que de la vitesse relative entre les référentiels, et d'aucune considération extérieure à ces deux référentiels. Pour plus de précision, on devrait dire des vitesses relatives des référentiels, le sujet est abordé un peu plus loin.
- Première utilisation de la vitesse de la lumière :
- Si dans le référentiel on considère le déplacement d'un signal lumineux dans le sens des x positifs, donc à la vitesse de la lumière, alors . Mais comme cette vitesse est la même dans le référentiel , en considérant le déplacement de ce même signal vu depuis ce référentiel, comme l'axe des x' a la même orientation que celui des x, et de même pour les axes temporels, on doit avoir [33]. De même, en commençant par considérer le signal depuis .
- Donc :
- Et comme x, t, x', t' sont liés par des relations linéaires à coefficients constants, on doit avoir et (avec a, b, a' et b' coeff constants), d'où , or comme , on en déduit , d'où pour un certain constant.
- Deuxième utilisation de la vitesse de la lumière :
- En considérant le déplacement d'un signal lumineux dans le sens des x négatifs, et en faisant le même raisonnement, on obtient : pour un certain constant.
- Conclusion sur la vitesse de la lumière :
- En additionnant et soustrayant les deux égalités précédentes, on obtient :
- avec : et .
- Première utilisation de la vitesse relative des référentiels :
- Pour l'origine du référentiel , on a et donc, d'après la première équation du système (2), on a :
- En désignant par la vitesse du référentiel par rapport au référentiel , on peut donc écrire
- , ou , avec
- On peut donc écrire :
- Deuxième utilisation de la vitesse relative des référentiels :
- Pour l'origine du référentiel , on a et donc, d'après les équations du système (2), on a :
- En désignant par la vitesse du référentiel par rapport au référentiel , on peut donc écrire
-