vuibert pdf final - département de philosophie jeudis hps(1).pdf · 2020. 9. 8. ·...

62
“000PpalVorms” — 2011/8/16 — 14:35 — page 1 — #5 Introduction O n appelle « théorie scientifique » la forme que prend en général la connaissance qui résulte des observations et des expérimentations des scientifiques sur un domaine particulier de phénomènes – par exemple, le mouvement des corps macroscopiques. Une théorie se distingue toutefois d’un simple compte rendu d’observation par le fait que, en plus de les décrire, elle permet de prédire et d’expliquer les phénomènes de son domaine, en exprimant des hypothèses à leur propos. Par exemple, la mécanique classique permet de prédire et d’expliquer le mouvement des corps macroscopiques en affirmant que la force qui s’exerce sur un corps est égale au produit de sa masse par son accélération ; la génétique mendélienne affirme que, lors de la formation des cellules sexuelles, les paires de gènes sont distribuées indépendamment les unes des autres ; et la théorie ricardienne de la valeur travail affirme que la valeur d’échange d’un bien est déterminée par la quantité de travail nécessaire à sa production. Ces hypothèses, que l’on appelle « lois », « principes », ou encore « théo- rèmes », selon la place qu’elles occupent dans la théorie, offrent plus qu’une simple description des phénomènes, aussi précise et exhaustive soit-elle : elles énoncent une certaine relation entre des concepts (masse, force, gène, valeur, travail) dont les référents n’appartiennent pas toujours au domaine de l’observable, mais qui peuvent être utilisés pour représenter les phénomènes observables. C’est là que réside le pouvoir prédictif et explicatif de la théorie : en utilisant ces concepts pour représenter une certaine situation (en les « reliant » aux phénomènes observables), on peut prédire les phénomènes à venir ou expliquer ceux qui se sont déjà produits (ou qui se produisent en général), en vertu de la relation que la théorie énonce entre ces concepts. Les théories scientifiques les plus mûres (en particulier dans le domaine des sciences physiques) se présentent souvent comme les expressions d’un ensemble d’hypothèses sous une forme systématique. Cet ensemble d’hypo- thèses grâce auxquelles une théorie nous permet de prédire et d’expliquer les phénomènes – ce qu’elle « nous dit » à propos du monde – est ce que l’on appelle son « contenu ». Le contenu d’une théorie peut être exprimé au moyen d’un certain nombre d’énoncés. Le plus souvent, il s’agit d’énoncés

Upload: others

Post on 26-Jan-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 1 — #5 ✐✐

    ✐✐

    ✐✐

    Introduction

    On appelle « théorie scientifique » la forme que prend en général laconnaissance qui résulte des observations et des expérimentations des

    scientifiques sur un domaine particulier de phénomènes – par exemple, lemouvement des corps macroscopiques. Une théorie se distingue toutefoisd’un simple compte rendu d’observation par le fait que, en plus de les décrire,elle permet de prédire et d’expliquer les phénomènes de son domaine, enexprimant des hypothèses à leur propos. Par exemple, la mécanique classiquepermet de prédire et d’expliquer le mouvement des corps macroscopiquesen affirmant que la force qui s’exerce sur un corps est égale au produit desa masse par son accélération ; la génétique mendélienne affirme que, lorsde la formation des cellules sexuelles, les paires de gènes sont distribuéesindépendamment les unes des autres ; et la théorie ricardienne de la valeurtravail affirme que la valeur d’échange d’un bien est déterminée par laquantité de travail nécessaire à sa production.

    Ces hypothèses, que l’on appelle « lois », « principes », ou encore « théo-rèmes », selon la place qu’elles occupent dans la théorie, offrent plus qu’unesimple description des phénomènes, aussi précise et exhaustive soit-elle :elles énoncent une certaine relation entre des concepts (masse, force, gène,valeur, travail) dont les référents n’appartiennent pas toujours au domaine del’observable, mais qui peuvent être utilisés pour représenter les phénomènesobservables. C’est là que réside le pouvoir prédictif et explicatif de la théorie :en utilisant ces concepts pour représenter une certaine situation (en les« reliant » aux phénomènes observables), on peut prédire les phénomènes àvenir ou expliquer ceux qui se sont déjà produits (ou qui se produisent engénéral), en vertu de la relation que la théorie énonce entre ces concepts.

    Les théories scientifiques les plus mûres (en particulier dans le domainedes sciences physiques) se présentent souvent comme les expressions d’unensemble d’hypothèses sous une forme systématique. Cet ensemble d’hypo-thèses grâce auxquelles une théorie nous permet de prédire et d’expliquerles phénomènes – ce qu’elle « nous dit » à propos du monde – est ce quel’on appelle son « contenu ». Le contenu d’une théorie peut être exprimé aumoyen d’un certain nombre d’énoncés. Le plus souvent, il s’agit d’énoncés

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 2 — #6 ✐✐

    ✐✐

    ✐✐

    2 Qu’est-ce qu’une théorie scientifique ?

    du langage naturel augmenté des termes utilisés pour exprimer les conceptsscientifiques qui n’ont pas toujours le sens qu’ils ont dans le langage courant(par exemple les notions de « force » et de « travail » en mécanique classique– ce dernier terme ayant même une signification différente dans les théoriesphysique et économique). En outre, l’expression du contenu des théoriesrequiert souvent l’utilisation de formalismes spécifiques, comme celui deséquations différentielles en physique.

    Une des tâches centrales de la philosophie des sciences est de clarifierle contenu des théories scientifiques existantes. Que signifie « clarifier lecontenu d’une théorie », et à quoi cela sert-il ? En raison même du fait queles termes théoriques comme ceux de force, de masse, ou de gène n’ont pasune signification empirique aussi facile à établir que celle de termes comme« chaise », « table » ou « caillou », le contenu des théories dans lesquelles cestermes figurent appelle un examen approfondi. Dans la mesure où la fonctiondes théories scientifiques est de nous aider à comprendre le monde empiriqueen prédisant et en expliquant les phénomènes observables, il est importantde s’assurer qu’elles ont bien une signification empirique, par opposition auxspéculations métaphysiques. Par exemple, afin de garantir la scientificitéde la mécanique classique, il convient de s’assurer que le concept de forcea une puissance explicative que n’a pas la notion de « vertu dormitive del’opium ». Pour cela, il faut clarifier la signification empirique du conceptde force, c’est-à-dire son lien aux phénomènes observables. De même, pourbien comprendre ce que la génétique classique nous dit des phénomènes del’hérédité, il faut s’assurer que le concept de gène n’est pas un mot videde sens, et qu’il permet de formuler une hypothèse féconde à propos de latransmission des caractères de génération en génération. Clarifier le contenud’une théorie en enquêtant sur la signification empirique de ses conceptspermet aussi, dans certains cas, d’en déterminer les limites, et d’en éclairerles relations avec d’autres théories. Ainsi, un des enjeux centraux de laclarification du concept de gène est d’analyser la relation entre génétiqueclassique et génétique moléculaire, en comparant leurs définitions respectivesdes gènes.

    Or, les concepts théoriques, en particulier dans le cas des théories sys-tématiques comme la mécanique classique, sont souvent définis par leurrelation à d’autres concepts théoriques (ainsi, la force est définie commele produit de la masse par l’accélération). Afin d’en saisir la significationempirique, il est donc également nécessaire de clarifier les liens déductifsentre les différentes hypothèses (principes, lois, théorèmes) de la théorie, etla manière dont ces hypothèses peuvent être utilisées pour représenter lesphénomènes. C’est la raison pour laquelle, depuis la fin du xixe siècle, lesphilosophes des sciences se sont donné pour tâche de clarifier la structurelogique et la signification empirique (ou signification physique) des théoriesscientifiques de leur temps, et en particulier de la mécanique classique.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 3 — #7 ✐✐

    ✐✐

    ✐✐

    Introduction 3

    Pourquoi la mécanique classique ? Cette dernière a très longtemps étéconsidérée comme la théorie physique tout entière, dont les autres disciplinesdevaient être des branches. S’assurer du bien-fondé empirique de la mécaniqueclassique était donc une étape nécessaire au fondement de la connaissancescientifique tout entière. À la fin du xixe siècle, dans un contexte où lesprémices de la crise de la physique qui va donner naissance aux théoriesde la relativité et à la théorie quantique se font sentir, marquant la findu règne de la physique classique, physiciens et mathématiciens (entreautres, Hertz, 1894, Mach, 1883, Poincaré, 1902, 1905, Boltzmann, 1897,von Helmholtz, 1847 et Kirchhoff, 1877) s’interrogent et débattent vivementsur le contenu et la place de la mécanique classique dans la connaissancescientifique. L’universalité du modèle explicatif de cette théorie, longtempsérigé en standard d’intelligibilité, étant remise en cause, il devient urgent,pour le défendre ou le combattre, d’en avoir une conception parfaitementclaire 2. Cela passe, la plupart du temps, par la recherche d’une présentationde la mécanique qui permettrait de faire apparaître clairement le statut deses différentes hypothèses et de donner une définition précise à ses différentsconcepts. Pour reprendre les termes de Poincaré, il s’agit alors de distinguernettement « ce qui est expérience, ce qui est raisonnement mathématique,ce qui est convention, ce qui est hypothèse » (Poincaré, 1905, chap. vi, « Lamécanique classique », p. 111). Ainsi la philosophie des sciences telle qu’elleest encore pratiquée aujourd’hui est-elle née dans le contexte d’une réflexioncritique sur la mécanique classique.

    Aujourd’hui, la mécanique classique n’est plus la théorie « reine ». Lesthéories de la relativité et la physique quantique l’ont privée de cette supré-matie, et elle n’est qu’un cas particulier de ces théories plus fondamentales.Pour autant, elle est encore souvent prise comme un exemple canoniquede théorie scientifique ; elle est très bien confirmée dans les limites de sondomaine, et elle présente une architecture déductive claire, reposant sur unpetit nombre de principes appelés « lois de Newton ». La plupart des analysesde la notion de théorie la prennent comme exemple, et il est largement re-connu qu’une définition satisfaisante de cette notion doit être en mesure d’enrendre compte. C’est souvent en référence à son expression systématique sousla forme de principes, de lois et de théorèmes, que ces notions mêmes sontdéfinies, et elle sert couramment de modèle au regard duquel sont évaluéesles autres théories scientifiques, en particulier en physique et en biologie. Enbref, l’identité de la mécanique classique et son statut de théorie scientifiquesont considérés – à très peu d’exceptions près – comme non problématiques,contrairement à ce qui est le cas, par exemple, pour la mécanique quantique,

    2 Historiquement, les réflexions critiques sur la mécanique classique ont aussi eu pour causela constitution de la thermodynamique.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 4 — #8 ✐✐

    ✐✐

    ✐✐

    4 Qu’est-ce qu’une théorie scientifique ?

    qui pose de difficiles problèmes faisant l’objet de nombreuses analyses parles philosophes des sciences d’aujourd’hui.

    Pourtant, un examen attentif de la mécanique classique révèle des dif-ficultés qui sont la plupart du temps passées sous silence ou minimiséespar les philosophes des sciences. Il existe en effet, aujourd’hui, plusieursformulations différentes de cette théorie. Certes, en un sens trivial, unethéorie peut toujours être exprimée sous plusieurs formulations différentes :si l’on identifie strictement une formulation à un ensemble d’énoncés dansun langage donné, alors on doit admettre que l’énoncé des principes d’unethéorie en français ne correspond pas à la même formulation que leur énoncéen anglais. Pour prendre un exemple différent, si l’on décidait subitementd’échanger systématiquement, dans l’énoncé des principes de la mécanique,chaque occurrence du terme « force » par le terme « masse » et vice versa,on obtiendrait deux formulations différentes. Il va de soi, pourtant, que cettemultiplicité de formulations possibles (ou actuelles) n’affecte aucunementl’identité de la théorie ainsi exprimée : le contenu véhiculé par ces différentesformulations est le même.

    Le problème posé par l’existence de plusieurs formulations de la méca-nique classique est beaucoup plus délicat. On distingue, aujourd’hui, lesformulations dites « newtonienne », « lagrangienne » et « hamiltonienne ».Si ces appellations suggèrent que ces formulations sont le résultat des in-novations de Newton, Lagrange et Hamilton, j’ignorerai, dans cet ouvrage,le problème diachronique du développement historique de la mécaniqueclassique, pour me concentrer sur le problème synchronique posé par la co-existence, dans la pratique et l’enseignement contemporains de cette théorie,de plusieurs formulations différentes.

    Ces formulations, comme on le verra au chapitre 1, diffèrent par la formedes équations utilisées pour représenter, prédire et expliquer les phénomènesdu mouvement, par leurs principes et concepts fondamentaux, et enfin parl’architecture déductive globale qu’elles donnent à la théorie. Les différentesformulations, comme on le verra, ne permettent pas de traiter les mêmesproblèmes, et leur utilisation ne requiert pas les mêmes opérations. Enfin,selon la formulation sous laquelle elle est présentée, les liens de la mécaniqueclassique avec les autres théories physiques n’apparaissent pas avec la mêmeclarté, et, pour ainsi dire, la « place » de cette théorie dans l’architecturegénérale de la connaissance scientifique change.

    Pourquoi, dès lors, considère-t-on généralement que ces différentes formu-lations sont les expressions d’une seule et même théorie, au point de prendrela mécanique classique comme parangon de ce que l’on appelle « théorie » ?Comme on le verra, une chaîne de déductions mathématiques permet depasser de n’importe laquelle de ces formulations à chacune des autres. Onpeut donc affirmer qu’elles sont logiquement équivalentes, ce qui semblebien garantir que leurs conséquences empiriques sont strictement identiques.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 5 — #9 ✐✐

    ✐✐

    ✐✐

    Introduction 5

    Ainsi, les prédictions fournies par les différentes formulations de la mécaniquene peuvent pas entrer en contradiction entre elles, même pour un domainerestreint de phénomènes. Même si leur place dans l’architecture d’ensemblede la théorie change, la définition logique des concepts qui y figurent est lamême : le concept de force, fondamental dans la formulation newtonienne,devient secondaire dans les formulations lagrangienne et hamiltonienne quis’appuient sur le concept d’énergie, mais sa définition n’est pas modifiée. Ence sens, la relation entre les formulations de la mécanique classique est trèsdifférente, par exemple, de la relation entre la mécanique newtonienne et lathéorie einsteinienne de la relativité restreinte, qui ne donnent pas la mêmedéfinition du concept de masse, et dont les prédictions diffèrent pour les trèsgrandes vitesses.

    Le jugement courant selon lequel la mécanique classique est bien uneseule et même théorie est donc sous-tendu par une certaine conception ducontenu, selon laquelle le contenu d’une théorie – ce qu’elle dit à proposdu monde – est indépendant de la forme sous laquelle il est usuellementprésenté. Autrement dit, les analyses classiques de la notion de théorie,et leur application à la mécanique classique, reviennent à considérer queles différences de formulation, pourvu qu’elles n’affectent pas l’ensembledes conséquences empiriques que l’on peut logiquement en déduire, n’ontpas plus d’incidence sur le contenu qu’elles expriment que ne l’aurait latraduction de l’une de ces formulations du français vers l’anglais. L’exigenced’objectivité et l’ambition de rejeter hors du domaine de la science toutetrace de métaphysique, qui caractérisent la tradition positiviste et empiriste,ont ainsi conduit les philosophes des sciences du xxe siècle à élaborer desoutils permettant d’identifier le contenu objectif des théories par-delà ladiversité possible ou actuelle de leurs formulations. Dans la lignée des travauxdes physiciens philosophes du xixe siècle mentionnés précedemment (Hertz,Mach, Poincaré, Boltzmann, von Helmholtz, Kirchhoff), il s’agit, pour lesempiristes logiques et leurs héritiers, de mobiliser les outils formels de lalogique mathématique pour « reconstruire » systématiquement le contenudes théories en le débarrassant de tous les aspects, jugés inessentiels, liés àleur formulation et à leur utilisation.

    Cet ouvrage vise à critiquer une telle perspective. Il ne s’agit pas, loin s’enfaut, de renoncer à l’exigence d’objectivité qui l’a historiquement motivée,mais bien plutôt de marquer les limites des analyses du contenu des théoriesqui, en refusant de prendre en compte la forme sous laquelle elles sontconstruites, développées, et utilisées, en font des abstractions inaccessibles àla compréhension des agents. En somme, je me propose de critiquer l’idéeselon laquelle les conditions de l’utilisation des théories (pour lesquelles laforme sous laquelle elles sont présentées est cruciale) sont sans pertinencepour l’analyse de leur contenu.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 6 — #10 ✐✐

    ✐✐

    ✐✐

    6 Qu’est-ce qu’une théorie scientifique ?

    Le premier chapitre, consacré à la mécanique classique, prend le contre-pied des analyses qui partent du présupposé selon lequel ses différentesformulations ne sont que des variantes notationnelles de la même théorie. Jem’y donne ainsi pour tâche d’étudier la manière dont la mécanique classiquepermet de prédire et d’expliquer les phénomènes en mettant en valeur lesdifférences entre ses formulations, afin d’évaluer dans quelle mesure et enquel sens on peut les considérer comme équivalentes. Cela me permet dejeter un premier doute, par l’exemple, sur la possibilité même d’identifierle contenu d’une théorie sans prendre en compte sa ou ses formulationsusuelles. Précisons d’emblée que ce premier chapitre comporte des aspectstechniques susceptibles de décourager les lecteurs peu familiers de certainsformalismes mathématiques ; si sa lecture apporte un éclairage utile à la suitede l’ouvrage, et s’il contient à lui seul l’amorce d’une nouvelle conceptiondes théories (exposée aux sections 1.4 et 1.5), il n’est pas indispensable d’enmaîtriser le détail pour aborder la lecture de la suite. Le lecteur qu’intéresseavant tout la conception des théories défendue par les empiristes logiques etpar leurs héritiers peut se rendre directement au chapitre 2.

    Le reste de l’ouvrage est ainsi consacré à l’examen critique des approchesdes théories caractéristiques de la tradition analytique en philosophie dessciences. Leurs avocats se sont efforcés de fournir une définition des théorieset d’élaborer des outils pour en étudier le contenu en partant du présupposéselon lequel le contenu d’une théorie est ce qui est indépendant de sesdiverses formulations. Le chapitre 2 présente ainsi la conception des théoriesscientifiques issue de l’empirisme logique, et en particulier des travauxde Rudolf Carnap et de Ernest Nagel. Le chapitre 3 est consacré à laclarification des thèses regroupées sous le nom de « conception sémantiquedes théories », et qui font aujourd’hui l’objet d’un consensus relativementlarge dans la communauté des philosophes des sciences. En convoquant ànouveau l’exemple de la mécanique classique, je propose, au chapitre 4, lacritique de cette conception, et plus largement des présupposés qui sous-tendent toute entreprise de reconstruction formelle des théories. Ce faisant,j’ai pour ambition d’apporter des arguments en faveur d’une démarcheconsistant à prendre en compte les conditions d’utilisation des théories et lamanière dont les agents les comprennent pour l’analyse de leur contenu.

    Au seuil de ce livre, une mise en garde s’impose. Les approches formelles,que j’y critique, sont des contributions majeures à la philosophie des sciencesdu siècle passé, et constituent aujourd’hui encore une branche importante dela recherche dans cette discipline. Mon propos n’est aucunement de nier lapertinence et la fécondité de ces approches. Je prétends seulement mettre enévidence leurs limites intrinsèques, et renouveler par là les réflexions sur lanotion de théorie tout en proposant une mise au point sur les développementsles plus récents de cette question en philosophie des sciences. Mais ce livre aégalement une visée pédagogique : par l’examen détaillé des conceptions des

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 7 — #11 ✐✐

    ✐✐

    ✐✐

    Introduction 7

    théories scientifiques proposées par les philosophes analytiques de la secondemoitié du xxe siècle, qui sont apparues tour à tour comme de véritablesorthodoxies en philosophie des sciences, il vise à clarifier les termes et lesenjeux d’un débat difficile et crucial pour cette discipline, pourtant malconnu du public francophone. En espérant rendre ces importants travauxaccessibles à ce public, il constitue, en tant que tel, un hommage à leursauteurs.

    Remerciements

    Cet ouvrage est tiré d’une partie de ma thèse de doctorat. Il n’aurait pasexisté sans le soutien et les conseils d’Anouk Barberousse et de Jean Gayon,qui ont dirigé cette thèse. Je les en remercie du fond du cœur. La lecturedes travaux de Paul Humphreys, ainsi que ses commentaires sur des versionspréliminaires de ce livre, ont eu une influence décisive sur son contenu. Jesuis très touchée qu’il ait accepté d’en rédiger la préface. Merci aussi àOlivier Darrigol et à Pierre Jacob pour m’avoir lue et conseillée, et à ThierryMartin, dont la confiance m’a permis de mener à bien cette publication.Enfin, pour leurs contributions directes ou indirectes, je tiens à remercierDelphine Chapuis-Schmitz, Isabelle Drouet, Henri Galinon, Alexandre Guay,Philippe Huneman, Cyrille Imbert, Vincent Israel-Jost, Soazig Le Bihan,Philippe Mongin, Eric Raidl et Pierre Wagner.

    Avertissement sur les citations

    Sauf mention contraire explicite lors de la première occurrence et dans labibliographie, la traduction française des ouvrages cités est la mienne. Lapagination de référence est celle de l’édition indiquée en bibliographie. Quandrien n’est précisé, les passages des citations en italique figurent sous cetteforme dans le texte original.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 8 — #12 ✐✐

    ✐✐

    ✐✐

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 9 — #13 ✐✐

    ✐✐

    ✐✐

    CHAPITRE 1

    La mécanique classique :

    une théorie, plusieurs formulations

    Quand on cherche à définir ce que l’on entend par « théorie scien-tifique », il semble naturel de se référer à des exemples de théories

    existantes. La mécanique classique en est un des plus fameux, et a longtempsété considérée comme un canon de théorie scientifique. Toute analyse satis-faisante de la notion de théorie doit donc être en mesure de rendre comptede cet exemple. Dans ce chapitre, je me propose d’examiner la questionsuivante : quel est le contenu de la mécanique classique ? Autrement dit, quenous dit-elle des phénomènes du mouvement, qui nous permet de les prédireet de les expliquer ?

    Les exposés peu approfondis de la mécanique classique se limitent gé-néralement à l’énoncé des lois dites « de Newton » et à la présentationde quelques problèmes que ces lois permettent typiquement de résoudre.Pourtant, une enquête plus poussée, passant notamment par la lecture desmanuels d’enseignement avancés et une attention à la pratique des scienti-fiques, révèle une caractéristique frappante de la mécanique classique, que lesphilosophes des sciences choisissent le plus souvent d’ignorer : cette théorieest, aujourd’hui, enseignée et utilisée sous plusieurs formulations différentes,qui se distinguent les unes des autres sous de nombreux aspects. Dans cechapitre, c’est en partant de la reconnaissance de ce fait remarquable queje me propose d’analyser le contenu de la mécanique classique. Je remetsainsi en question le jugement largement partagé selon lequel les différentesformulations de la mécanique sont les expressions équivalentes d’une seuleet même théorie, afin de répondre à la question suivante : la multiplicitédes formulations de la mécanique classique a-t-elle une conséquence sur soncontenu ? Ce que dit cette théorie dépend-il de la manière dont elle le dit ?

    Pour commencer (section 1.1), je présente sommairement la manière donton identifie généralement le contenu de la mécanique classique, et j’esquisseà grands traits les principales différences entre ses formulations. Les deux

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 10 — #14 ✐✐

    ✐✐

    ✐✐

    10 Chapitre 1. Formulations de la mécanique classique

    sections suivantes sont consacrées à l’examen 1 successif des formulationsdites « newtonienne » (section 1.2) et « lagrangienne » (section 1.3). Lasection 1.4, en dressant le bilan des différences entre ces formulations, chercheà déterminer dans quelle mesure, et selon quelle définition du contenu desthéories, on peut dire qu’elles expriment néanmoins un seul et même contenu.La section 1.5 montre que la conception des théories au nom de laquelleon affirme généralement l’équivalence des formulations de la mécaniqueest insatisfaisante, et elle définit par contraste une approche qui prend encompte, dans l’analyse du contenu même des théories, la forme sous laquelleelles sont présentées et utilisées par les agents. Enfin, la section 1.6 dresse lebilan de cette analyse et en montre la place dans l’économie d’ensemble del’ouvrage.

    1.1 Quel est le contenu de la mécanique classique ?

    Une première manière d’identifier la mécanique classique consiste à définirle domaine de phénomènes auquel elle s’applique et dans les limites duquelelle est valide : c’est la théorie physique qui étudie le mouvement des corpsmacroscopiques, dans les cas où leur vitesse est très inférieure à celle dela lumière, ce qui exclut les phénomènes quantiques et relativistes 2. Desphénomènes comme la chute des corps sur Terre, le mouvement oscillatoired’un pendule, la trajectoire relative des astres, sont typiquement dans ledomaine d’étude de la mécanique.

    À l’époque de leur première présentation systématique par Isaac Newtondans les Philosophiæ Naturalis Principia Mathematica (Newton, 1687), lesprincipes de la mécanique étaient conçus comme pouvant fournir une explica-tion universelle des phénomènes du mouvement. De plus, pour Newton, ainsique, plus tard, pour les défenseurs de l’hypothèse atomiste, la mécaniqueétait censée expliquer non seulement les phénomènes du mouvement, maisaussi l’ensemble des phénomènes physiques et chimiques. Au xxe siècle, ladouble révolution constituée par l’énoncé des théories de la relativité parAlbert Einstein et la naissance de la mécanique quantique assigne des limitesau domaine d’application de la mécanique désormais « classique » ; on sait

    1 Je me suis principalement appuyée, pour cet exposé, sur deux ouvrages de référence enmécanique, ceux de Herbert Goldstein (1950/2002) et de Cornelius Lanczos (1970). Lescours de Jean-Michel Raimond (2000), ainsi que les articles de Jeremy Butterfield (2004)et de Jill North (2009a,b) m’ont également été utiles.

    2 Cette définition du domaine de la mécanique classique est quelque peu restrictive, dans lamesure où l’on peut, au moyen des équations de la mécanique, étudier des comportementsplus généraux que le mouvement des corps. C’est cependant à eux seuls que je m’intéresseici.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 11 — #15 ✐✐

    ✐✐

    ✐✐

    1.1 Quel est le contenu de la mécanique classique ? 11

    maintenant que sa validité n’est pas universelle, puisqu’elle est fausse en cequi concerne les phénomènes microscopiques et cosmologiques.

    Définir ainsi son domaine d’application n’est toutefois pas suffisant pouridentifier une théorie ; on peut en effet avoir plusieurs théories différentes,contradictoires ou incompatibles entre elles, portant sur un même domainede phénomènes. On veut donc aussi pouvoir identifier ce que la théorie dit deces phénomènes, c’est-à-dire l’ensemble des hypothèses au moyen desquelleselle nous permet de les prédire et de les expliquer. De prime abord, cetteexigence semble facile à satisfaire pour la mécanique classique : elle peut êtreprésentée, comme c’est le cas dans les Principia de Newton, sous la formed’un ensemble déductif d’énoncés exprimant des hypothèses théoriques. Selonles présentations, ces différentes hypothèses se voient attribuer un statutplus ou moins fondamental. Quoique les usages varient, les plus générales etfondamentales sont couramment appelées « principes 3 ». Viennent ensuiteles lois et les théorèmes. Les lois correspondent à la forme que prennent lesprincipes quand ils sont appliqués à certains types particuliers de forces oude mouvements (par exemple, la loi de gravitation ou la loi du pendule). Lesthéorèmes peuvent être définis comme des conséquences remarquables desprincipes (par exemple, les théorèmes de conservation). Une telle présentationsystématique de la mécanique est si commune que c’est souvent sur uneréférence à cet exemple que s’appuient l’analyse et la définition philosophiquesdes notions de principes, lois et théorèmes.

    Ces différentes hypothèses, jointes à l’ensemble de leurs conséquencesdéductives – ce que les logiciens appellent leur « clôture déductive » –,semblent constituer un ensemble clairement défini que l’on peut appeler le« contenu » de la mécanique. Celui-ci consisterait ainsi en l’ensemble despropositions que l’on peut en principe déduire des lois fondamentales deNewton 4. Pourtant, un examen attentif des différentes manières dont cecontenu peut être exprimé fait surgir plusieurs difficultés, qui conduisent àremettre en question l’identité même du contenu de la mécanique classique.

    La mécanique classique est, aujourd’hui, enseignée et utilisée sous plu-sieurs formulations différentes. On distingue la formulation dite « newto-nienne » ou encore « vectorielle 5 » de la formulation dite « analytique » ou« variationnelle », laquelle se présente elle-même sous plusieurs formulationsdifférentes (lagrangienne, hamiltonienne, théorie de Hamilton-Jacobi). Si lenom de chacune de ces formulations indique que la paternité en est attribuée

    3 Newton, pour qui il s’agit de principes mathématiques, les appelle « axiomes ». On lesappelle aussi parfois les « lois de Newton ».

    4 Moyennant parfois, comme dans le cas de la loi de gravitation, l’introduction d’unehypothèse indépendante.

    5 La formulation vectorielle de la mécanique n’est en fait pas due à Newton, mais elle utiliseles mêmes concepts physiques (en particulier celui de force).

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 12 — #16 ✐✐

    ✐✐

    ✐✐

    12 Chapitre 1. Formulations de la mécanique classique

    à des savants d’époques différentes qui ont contribué aux développementsde la mécanique (Newton, 1687 ; Lagrange, 1788 ; Hamilton, 1834), lesproblèmes sur lesquels je souhaite ici mettre l’accent gagnent à être abordésen faisant abstraction du développement historique qui a conduit à instituerces formulations comme standard 6.

    Ces problèmes sont ceux de la coexistence, aujourd’hui, dans l’enseigne-ment et la pratique de la mécanique, de plusieurs formulations, dont il estassez largement reconnu qu’elles sont les expressions d’une seule et mêmethéorie (autrement dit, que leur contenu est identique). Comme on va levoir, ces formulations se distinguent les unes des autres par leurs concepts etleurs principes fondamentaux, ainsi que par les systèmes de coordonnées etla forme des équations utilisées pour représenter la dynamique des systèmesphysiques. Ces différences de représentation ont d’importantes conséquencessur la manière dont on peut résoudre des problèmes de mécanique, c’est-à-direprédire et expliquer l’évolution dynamique de certains systèmes physiques.Résoudre un problème de mécanique consiste à trouver les fonctions quidécrivent l’évolution de la position et de la vitesse du système étudié aucours du temps. Ces fonctions sont les solutions d’un ensemble d’équationsdifférentielles 7 qui gouvernent la dynamique du système ; cela signifie qu’ellesdisent quelles trajectoires le système peut suivre en le représentant dans unespace donné et à l’aide d’un certain système de coordonnées. La résolutiond’un problème de mécanique suit typiquement deux étapes. La première est

    6 Je passerai notamment sous silence le problème de la relation entre les présentationshistoriquement proposées par Lagrange ou Hamilton et ce que l’on appelle « formulationlagrangienne » et « formulation hamiltonienne », et la question de savoir dans quellemesure l’attribution de ces noms aux formulations d’aujourd’hui est légitime. Notons,d’ailleurs, que le « découpage » entre formulations le plus couramment trouvé dans lesmanuels est contestable, et n’a pas toujours été le même : des savants post-hamiltonienscomme Hertz, Mach, ou Duhem ne traçaient pas la frontière entre ce qu’il convenaitd’appeler selon eux les formulations « newtonienne », « lagrangienne » et « hamiltonienne »au même endroit. À ce sujet, ainsi que pour un examen du problème de la nature deschangements introduits successivement par les « grands noms » de la mécanique classique,voir Vorms, 2009, chap. 3.

    7 Le rôle fondamental des équations différentielles en physique a été maintes fois souli-gné ; ainsi, Vladimir Arnold affirme : « La découverte fondamentale de Newton, cellequ’il a considéré devoir garder secrète et qu’il a publiée seulement sous la forme d’uneanagramme, est la suivante : Data aequatione quotcunque fluentes quantitae involventefluxiones invenire et vice versa. En langage mathématique contemporain, cela signifie :“Il est utile de résoudre des équations différentielles” » (Arnold, 1988, préface). JeremyButterfield cite Poincaré : « Sans la physique, nous ne connaîtrions pas les équationsdifférentielles » (Butterfield, 2004, p. 19). Voir aussi Mach, 1883, p. 321 : « La physiques’habitue progressivement à considérer la description des faits au moyen d’équationsdifférentielles comme son véritable but. » Pour une analyse historique et philosophique desnotions de fonctions et du rôle des équations différentielles dans la solution des problèmesdynamiques, voir Butterfield, 2004, p. 10-23, et les sources auxquelles il renvoie (Bottazini,1986 ; Lützen, 2003 ; Kline, 1972 ; Youschkevitch, 1976).

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 13 — #17 ✐✐

    ✐✐

    ✐✐

    1.2 Formulation newtonienne 13

    celle de la mise en équation : il s’agit d’écrire les équations du mouvementdu système étudié à partir des informations dont on dispose à propos dece système. La seconde étape est la résolution de ces équations, c’est-à-direleur intégration.

    Comme on va le voir, l’utilisation de différents outils mathématiques (eux-mêmes liés à différents principes et systèmes de concepts) pour représenterles phénomènes du mouvement a des conséquences pratiques sur les deuxétapes de la résolution de problèmes mécaniques. C’est l’étude du lien entredifférences de représentation et différences pratiques qui offre le fil directeurdes deux prochaines sections du présent chapitre, consacrées respectivementaux formulations newtonienne et lagrangienne de la mécanique.

    Avertissement Les deux sections qui suivent (1.2 et 1.3) comportent desaspects techniques dont la compréhension détaillée n’est pas, en tant quetelle, indispensable à l’intelligibilité de la suite de l’analyse. Rejetant certainsdéveloppements en annexe (à la fin de l’ouvrage), j’ai cependant conservédans ce qui suit le minimum nécessaire à la justification des conclusions queje tire dans les sections 1.4 et 1.5. Le lecteur que rebutent les formalismesmathématiques indispensables à la présentation des formulations newtonienneet lagrangienne peut se reporter directement aux sections 1.4 et 1.5, qui fontréférence aussi souvent et précisément que possible aux passages pertinentsdes sections 1.2 et 1.3.

    1.2 Formulation newtonienne

    La formulation newtonienne 8 est la première, et souvent la seule, que l’onapprend avant d’entreprendre des études approfondies de physique ou d’in-génierie. Elle est souvent introduite comme un préalable aux autres formu-lations, dont l’appareil mathématique est moins élémentaire. Dans ce quisuit, je présente les outils mathématiques qu’elle mobilise pour représenterles phénomènes mécaniques (section 1.2.1), puis les principes qui permettentd’obtenir les équations du mouvement gouvernant la dynamique des systèmes(section 1.2.2), et enfin la manière dont, en pratique, on peut utiliser ceséquations pour résoudre des problèmes (section 1.2.3).

    8 On l’appelle aussi « vectorielle ». Précisons cependant que c’est Euler qui, en 1749, écritla deuxième loi de Newton sous la forme qu’on lui connaît aujourd’hui (en coordonnéescartésiennes, cependant, et non à l’aide d’une notation vectorielle). En outre, la notion depoint matériel, et l’interprétation atomiste qui lui est associée, est attribuée à Boscovitch,dans sa Philosophiæ naturalis Theoria de 1758.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 14 — #18 ✐✐

    ✐✐

    ✐✐

    14 Chapitre 1. Formulations de la mécanique classique

    1.2.1 Outils mathématiques de la représentation des systèmes mécaniques

    Une des notions de base de la mécanique newtonienne est celle de pointmatériel (ou particule). Il s’agit d’un point géométrique, c’est-à-dire dépourvud’étendue mais doté d’une grandeur appelée « masse 9 » représentée par unréel positif m. L’espace de représentation du point matériel en mécaniquenewtonienne est un espace affine euclidien, défini par un espace vectorielde dimension finie (et plus précisément à trois dimensions, quand le pointmatériel se meut dans un espace physique à trois dimensions) muni d’unproduit scalaire, permettant de définir une distance et des angles. Le systèmede coordonnées le plus couramment utilisé en mécanique newtonienne estcelui des coordonnées rectangulaires ou cartésiennes. Il arrive cependantque l’on fasse usage de coordonnées polaires pour certains problèmes 10. Laposition d’un point matériel dans cet espace est donc entièrement déterminéepar trois coordonnées.

    Notons que l’on représente souvent un solide par un point matériel quel’on situe en son centre d’inertie ; c’est le cas lorsqu’on étudie par exemplele mouvement des planètes et de leurs satellites. Dans le cas d’un solideindéformable 11 qui se meut librement dans un espace à trois dimensions, lenombre de coordonnées indépendantes, appelées aussi « degrés de liberté »,nécessaires à la détermination de sa position et de son orientation est desix 12.

    On distingue, au sein de la mécanique, entre la cinématique, qui estla description du mouvement des corps, et la dynamique, qui est l’étudedes causes de ce mouvement. Les notions de base de la cinématique sontcelles de position, de vitesse et d’accélération. Elles sont habituellementreprésentées par des vecteurs. Soit s la courbe décrite par la particuledans son mouvement et r le rayon vecteur 13 pointant de l’origine vers la

    9 D’autres grandeurs peuvent caractériser l’état d’un point matériel, comme la charge. Jene m’en occuperai pas dans cet exposé.

    10On utilise les coordonnées cylindriques pour les problèmes qui font intervenir une directionprivilégiée, par exemple lors de l’étude du mouvement de rotation d’un système autourd’un axe. On utilise les coordonnées sphériques pour l’étude des cas où une propriété nedépend que de la distance à un point ; il peut alors être commode de considérer ce pointcomme l’origine O d’un système de coordonnées sphériques.

    11Un système matériel est dit « solide indéformable » ou « corps rigide » si les distancesmutuelles des points matériels qui le constituent ne varient pas au cours du temps. Jeparlerai simplement de « solide » dans la mesure où je ne m’intéresserai pas aux problèmesde déformation.

    12Ce sont les trois coordonnées de position nécessaires à la détermination de la position d’unpoint dans un espace à trois dimensions, et les trois coordonnées angulaires permettant dedéterminer l’orientation du solide. Ces trois coordonnées angulaires sont appelées « anglesd’Euler ».

    13J’adopte dans toute cette étude la convention orthographique qui consiste à représenterles quantités vectorielles par des caractères gras.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 15 — #19 ✐✐

    ✐✐

    ✐✐

    1.2 Formulation newtonienne 15

    particule. r est appelé « vecteur position » et ses coordonnées (x, y, z) sontles coordonnées cartésiennes de position de la particule. La vitesse étantla dérivée de la position par rapport au temps 14, le vecteur vitesse peutalors être défini par l’équation v = drdt ou v = ṙ. L’accélération est la dérivéede la vitesse par rapport au temps, ou la dérivée seconde de la position :a = d2rdt2 =

    dvdt ou a = r̈

    15.L’état d’un système à un instant t est caractérisé par les positions et

    les vitesses de chacune de ses particules à cet instant t, jointes à leurscaractéristiques intrinsèques, comme la masse. L’état d’un système à chaqueinstant est donc spécifié par deux ensembles de coordonnées, celles despositions r et celles des quantités de mouvement p (la quantité de mouvement– ou impulsion – d’un point matériel est le produit de sa masse par sa vitessemv) de chacune de ses particules. Si ces dernières se meuvent librementdans un espace à trois dimensions, la position et la quantité de mouvementde chacune d’elles ont chacune trois composantes. L’état d’une particuleunique est donc donné par six coordonnées, trois pour la position et troispour la quantité de mouvement. L’état d’un système à n particules est doncentièrement spécifié par un total de 6n coordonnées.

    1.2.2 Lois de la dynamique

    La dynamique est l’étude des causes du mouvement. Le concept central dela dynamique newtonienne est celui de « force ». Les trois lois de Newton,également appelées « axiomes » du mouvement, gouvernent la dynamiquedes systèmes de particules 16.

    Première loi de Newton : le principe d’inertie

    Le principe d’inertie stipule que le mouvement d’un point matériel auquelaucune force extérieure ne s’applique est rectiligne et uniforme ; c’est-à-direque, sans l’action d’une force, la vitesse d’un point matériel ne peut changer,son mouvement ne peut subir aucune accélération. Ce principe donne la

    14La dérivée est calculée par le passage à la limite :

    drdt

    = lim∆t→0r2 − r1

    ∆t; lim∆t→0

    ∆s∆t

    = dsdt

    15Le point (ṙ) est utilisé pour symboliser la dérivée première par rapport au temps, et ledouble point (r̈) pour symboliser la dérivée seconde par rapport au temps.

    16Le statut de ces différents principes et la question de savoir s’ils sont des postulats, desdéfinitions ou des lois empiriques ont fait l’objet de nombreux débats depuis le xviiie siècle.En particulier, la deuxième loi peut être interprétée comme un postulat fondamental oucomme une définition de la force et de la masse.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 16 — #20 ✐✐

    ✐✐

    ✐✐

    16 Chapitre 1. Formulations de la mécanique classique

    définition des référentiels 17 galiléens (ou référentiels d’inertie) : ce sont lesréférentiels où ce principe, associé à un espace euclidien, est valable 18.

    Le principe de relativité galiléenne stipule que les lois de la mécaniquesont invariantes relativement à une transformation galiléenne. Cela signifieque tous les repères galiléens sont équivalents : si deux observateurs sontanimés d’un mouvement de translation uniforme l’un par rapport à l’autre,alors les mêmes lois du mouvement doivent s’appliquer à chacun d’eux.

    Deuxième loi de Newton : le principe fondamental

    de la dynamique (PFD)

    On peut définir la force comme la cause de l’accélération d’un point matériel.On représente la force, comme les grandeurs cinématiques, par un vecteur.La force F agissant sur un point en modifie la vitesse, en fonction de lamasse m du point 19.

    Le principe fondamental de la dynamique (ou relation fondamentale dela dynamique, parfois noté « PFD ») stipule que, dans un référentiel galiléen,la force qui s’exerce sur un point matériel est égale à la dérivée par rapportau temps du vecteur « quantité de mouvement », soit :

    F = dpdt (1.1)

    Cette équation peut aussi s’écrire :

    F = ddt (mv) (1.2)

    Quand la masse est constante, on peut écrire le PFD sous sa forme plusfamilière :

    F = ma (1.3)

    Troisième loi de Newton : le principe des actions réciproques

    ou principe de l’égalité et de la réaction

    À strictement parler, on quitte ici le domaine de l’étude du mouvement d’unpoint matériel isolé, pour aborder celle des systèmes de points matériels.Considérons deux points matériels i et j en interaction. Notons Fij la force

    17Un référentiel est un système d’axes lié à un observateur auquel est associé un temps t.18Ce principe peut être considéré comme une simple définition, comme un postulat théorique,

    ou comme l’hypothèse non triviale de l’existence de référentiels galiléens.19La mécanique newtonienne ne distingue pas entre masse inertielle et masse gravitationnelle.

    L’inertie du corps, c’est-à-dire sa résistance au mouvement, est caractérisée par la quantitéde mouvement p = mv.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 17 — #21 ✐✐

    ✐✐

    ✐✐

    1.2 Formulation newtonienne 17

    exercée par le point i sur le point j et Fji la force exercée par j sur i ; leprincipe des actions réciproques – ou principe de l’égalité de l’action et dela réaction – stipule que ces deux forces sont opposées, et égales en module,ce qui se traduit par la relation :

    Fij = −Fji (1.4)

    Remarques

    1. Ce qui précède concerne l’étude de mouvements rectilignes. Quand onsort de ce domaine, on emploie les équivalents angulaires de la position,de la vitesse et de l’accélération linéaires (voir l’annexe A) 20.

    2. Les trois lois exposées s’étendent sans modification profonde aux sys-tèmes de particules (voir l’annexe B). Il faut cependant distinguerentre les forces externes, agissant sur les points matériels et dues à descauses extérieures au système, et les forces internes, agissant sur unpoint matériel i et dues aux autres points matériels du système. Ladeuxième loi de Newton prend alors cette forme :

    jFji + F(e)i = ṗi (1.5)

    où F(e)i représente une force externe et Fji est la force interne due à laparticule j agissant sur la particule i.

    3. Dans les présentations courantes de la formulation newtonienne, onajoute généralement à l’exposé des trois lois du mouvement celui decertains théorèmes de conservation. Certains sont des conséquencesdirectes des lois du mouvement ; d’autres nécessitent l’introduction denotions (celles d’énergie cinétique, d’énergie potentielle et de travail)qui ne figurent pas dans l’énoncé de ces lois, et qui sont par conséquentdéfinies ad hoc (voir l’annexe C) ; ces notions sont en revanche, commeon le verra, les concepts fondamentaux des formulations analytiquesde la mécanique.

    1.2.3 En pratique

    Résoudre un problème de mécanique consiste, typiquement, à prédire l’évo-lution dynamique d’un système, c’est-à-dire l’évolution de la position et de

    20Les démonstrations trop longues pour figurer dans le texte principal, ainsi que certainsdéveloppements importants pour une étude approfondie de la mécanique, mais qui neservent pas directement mon propos, sont placés à la toute fin de ce livre, en annexes. J’yrenvoie régulièrement au cours de l’exposé qui suit.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 18 — #22 ✐✐

    ✐✐

    ✐✐

    18 Chapitre 1. Formulations de la mécanique classique

    la vitesse de ses différents points au cours du temps. La deuxième loi deNewton, ou principe fondamental de la dynamique, gouverne l’évolutiondynamique de tout système : elle détermine à elle seule les trajectoirespossibles pour ce système. En représentant l’état mécanique d’un système aumoyen d’équations qui ont la forme du PFD, on est en principe en mesured’effectuer des calculs qui permettent de prédire l’état de ce système à toutinstant t. Cela signifie que la solution d’un problème de mécanique dansle cadre newtonien est apportée par la résolution d’une série d’équationsdifférentielles de la forme suivante :

    mid

    2xi

    dt2= Fi =

    jFij + F(e)i (1.6)

    En un sens, tout ce que la théorie newtonienne dit à propos du mouvementdes corps est contenu dans l’énoncé des trois lois du mouvement, qui offrentune représentation mathématique de tous les phénomènes du mouvement.Cependant, telle quelle, l’équation (1.6) est un principe abstrait : elle donnela forme générale des équations du mouvement, mais elle ne permet pasencore de dire quoi que ce soit du comportement d’un système ou d’un typede systèmes. C’est, comme le note Kuhn, une simple « esquisse de loi 21 ».

    L’utilisation de la théorie newtonienne pour résoudre des problèmes demécanique nécessite donc un apprentissage qui dépasse celui des trois lois deNewton. Prédire et expliquer des phénomènes particuliers implique d’être enmesure de les représenter au moyen de la deuxième loi de Newton, c’est-à-direde donner un contenu à cette forme de loi de telle sorte qu’elle soit bien lareprésentation d’un système particulier.

    Plusieurs étapes sont nécessaires pour obtenir la description de l’évolutionmécanique d’un système particulier 22. Il faut tout d’abord spécifier la naturedes forces en présence : les forces externes appliquées au système et les

    21Voir Kuhn, 1969, 1970a. Voir aussi Cartwright, 1999, p. 180 et Giere, 1988. L’idée selonlaquelle les lois théoriques ne « disent rien » par elles-mêmes est un des arguments courantscontre les conceptions des théories scientifiques qui les définissent comme des ensemblesde principes joints à l’ensemble de leurs conséquences déductives, que Cartwright (1999,chap. 8), appelle les conceptions « distributeur automatique » (vending machine view oftheory) ; la plus célèbre de ces conceptions est celle des empiristes logiques, à laquelle lechapitre 2 du présent ouvrage est consacré. Ses défenseurs prennent bien évidemment encompte la nécessité d’ajouter à ces principes des règles permettant de les appliquer auxphénomènes, mais ils décrivent ces règles d’une manière qui, selon leurs critiques – quej’endosse –, ne rend pas compte des opérations nécessaires à la transformation des loisthéoriques en des descriptions effectives des phénomènes, opérations qui requièrent unegrande part de créativité de la part des agents.

    22L’analyse détaillée des opérations dans lesquelles consiste chacune de ces étapes est undes aspects du projet sur la modélisation conduit par Nancy Cartwright, Mary Morgan etMargaret Morrison (voir Cartwright, 1999 ; Morgan et Morrison, 1999). Elle s’accompagnede la thèse selon laquelle les modèles sont des outils autonomes, qui permettent d’opérer

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 19 — #23 ✐✐

    ✐✐

    ✐✐

    1.2 Formulation newtonienne 19

    forces internes s’exerçant entre les différentes particules du système. Il existeplusieurs types de force (force de frottement, force de gravitation, forcede rappel...). On appelle « loi de force » ou « fonction de force » la formeparticulière que prend le F du principe fondamental de la dynamique selonle type de force en jeu. Une fois ces forces identifiées, on peut écrire leséquations du mouvement du système. Ce sont des équations vectorielles ; ily en a une pour chaque particule et pour chaque composante de la direction.Elles gouvernent entièrement l’évolution dynamique du système, pour unétat initial donné.

    L’étape suivante consiste à donner les conditions cinématiques initialesdu système, c’est-à-dire les positions et quantités de mouvement initialesde chacune de ses particules. Intégrer deux fois 23 chaque équation conduitalors à une solution unique pour chaque particule. Cette solution est unefonction vectorielle de la position de la particule en fonction du temps r(t), etpermet par conséquent de déterminer la position et la vitesse de la particuleà chaque instant.

    Utiliser la mécanique newtonienne pour résoudre des problèmes impliquedonc l’acquisition d’un savoir-faire qui dépasse la connaissance des hypothèsesthéoriques in abstracto. En particulier, cela implique, face à une situationconcrète plus ou moins complexe, de savoir identifier les forces en présence,externes et internes, c’est-à-dire de savoir représenter un système particuliercomme un système newtonien. Selon les cas, la forme que prend alors le PFDpeut le rendre méconnaissable aux yeux du novice. Comme Kuhn l’a misen évidence, les étudiants acquièrent typiquement ce savoir-faire au moyendes exercices proposés dans les manuels, qui leur présentent des exemplestypes, ou cas exemplaires (exemplars), dont la difficulté s’accroît au fur et àmesure de l’apprentissage, et qui les préparent à savoir trouver, par la suite,la solution à des problèmes jamais rencontrés auparavant (voir notammentKuhn, 1969) 24.

    Exemples types d’application des lois de Newton

    La plupart des manuels de mécanique, en plus de l’énoncé des trois loisde Newton, considèrent comme partie intégrante de la théorie mécanique

    une médiation entre la théorie et les phénomènes sans toujours dériver de la théorieelle-même.

    23Les équations du mouvement sont des différentielles du second ordre ; c’est la raison pourlaquelle on a besoin de deux ensembles de valeurs initiales (positions et quantités demouvement).

    24Pour une analyse plus détaillée du rôle de la notion de cas exemplaire et, plus largement,de la manière dont, en pratique, les scientifiques appliquent les représentations théoriquesà des cas particuliers, voir Vorms, 2009, chap. 6.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 20 — #24 ✐✐

    ✐✐

    ✐✐

    20 Chapitre 1. Formulations de la mécanique classique

    certaines lois de force comme celles de la gravitation universelle 25 ou de cer-taines forces de rappel. Ces lois, que l’on peut appeler « lois phénoménales »,sont générales, au sens où elles ne concernent pas un système en particulier,mais tous les systèmes soumis à un certain type de forces (en termes logiques,elles font intervenir un quantificateur universel). Elles sont cependant moinsabstraites que le PFD, dont elles sont une spécification : contrairement auPFD, elles ont un contenu empirique, au sens où elles disent quelque chose àpropos d’un certain type de forces.

    Les manuels de mécanique sont la plupart du temps organisés en chapitresdont chacun est consacré à l’examen d’un type particulier de forces, et à larésolution de plusieurs problèmes exemplaires 26. Dans ce qui suit, j’exposedeux de ces problèmes exemplaires, que les manuels les plus élémentairesne manquent jamais de présenter. Les systèmes concernés sont des massesponctuelles, ce qui évite le problème d’avoir à spécifier les forces internesau système (celles qui s’exercent entre les particules). Dans les deux cas, laforce qui s’exerce sur le système est une force de rappel.

    Le système masse-ressort. Loi de Hooke. La loi de Hooke gouvernela force de rappel s’exerçant par exemple dans un système (voir figure 1.1)constitué d’une masse m liée à un ressort accroché à un support fixe 27 ; leressort commence par s’étirer pour équilibrer la force de gravité ; une fois àl’équilibre, on peut étudier le déplacement vertical de la masse à partir desa position d’équilibre.

    On appelle x le déplacement vertical et on suppose que l’allongement duressort est parfaitement linéaire, auquel cas la force de rappel, lorsque leressort est tiré, est exactement proportionnelle au déplacement de la massepar rapport à sa position d’équilibre. La loi de Hooke stipule ainsi que laforce exercée par un ressort est proportionnelle à son extension. La force estdonc −kx (le signe « − » indique que c’est une force de rappel). Dans le casdu ressort, la constante k est interprétée comme une mesure de la raideur

    25Voir l’annexe D.26Sur ce point, voir Giere, 1988, p. 6.27Le système masse-ressort est l’exemple le plus simple de ce que l’on appelle « oscillateur

    harmonique ». L’oscillateur harmonique est un exemple du mouvement périodique d’unegrande importance car il sert de modèle dans beaucoup de problèmes de physique classiqueou quantique. Il désigne le mouvement d’un point au voisinage d’une position d’équilibrestable. Les systèmes classiques qui sont des réalisations de l’oscillateur harmoniquecomprennent tous les systèmes stables quand on les écarte un peu de leur positiond’équilibre. La notion d’oscillateur harmonique désigne donc le mouvement d’un pointau voisinage d’une position d’équilibre stable. Les propriétés les plus importantes del’oscillateur harmonique sont les suivantes : 1. la fréquence du mouvement est indépendantede l’amplitude de l’oscillation ; 2. on peut superposer linéairement les effets de plusieursforces appliquées.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 21 — #25 ✐✐

    ✐✐

    ✐✐

    1.2 Formulation newtonienne 21

    m

    Figure 1.1. Système masse-ressort.

    du ressort. Le principe fondamental de la dynamique s’écrit alors :

    F = ma = md2x

    dt2= −kx (1.7)

    où k est la constante de proportionnalité.Pour résoudre cette équation, et obtenir ainsi v(t) et x(t), une méthode

    simple consiste à définir ω2 = km

    ; l’équation 1.7 devient alors a + ω2x =d

    2x

    dt2 + ω2x = 0. On peut montrer que les solutions de cette équation pour

    la position et la vitesse en fonction du temps ont la même forme généraleharmonique représentée par la fonction :

    f(t) = A cos ω t + B sin ω t (1.8)

    où A et B sont des constantes qui correspondent respectivement à la positioninitiale et à la vitesse initiale. Par exemple, si le ressort est tiré puis relâchésans vitesse initiale, les conditions initiales sont x(t = 0) = A et v(t = 0) =B = 0. Dans ce cas, la solution de l’équation se réduit à 28 :

    x(t) = A cos ω t v(t) = −Aω sin ω t (1.9)

    Les graphes des deux fonctions ont une forme sinusoïdale. Pour les conditionsinitiales x(t = 0) = A et v(t = 0) = 0, on obtient les graphes de la figure 1.2.

    Le pendule simple Un autre exemple de mouvement harmonique simpleest offert par celui du pendule simple, dans la limite des petits angles

    28Pour résoudre ce problème, on peut aussi utiliser la conservation de l’énergie. En effet,puisque la force est conservative (voir ci-dessous page 32, ainsi que l’annexe C), F (x) =−∇V (x) pour l’énergie potentielle V (x). En intégrant F (x) = ma, on obtient l’équation12 mv

    2 + V (x) = E, avec E l’énergie totale. On résout pour 1v

    et on intègre pour obtenirla solution.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 22 — #26 ✐✐

    ✐✐

    ✐✐

    22 Chapitre 1. Formulations de la mécanique classique

    x(t)

    v(t)

    t

    Figure 1.2. Position x et vitesse v de la masse m de la masse en fonction du temps t.

    d’oscillation. Le pendule simple (figure 1.3) consiste en une masse ponctuellem à l’extrémité inférieure d’un fil inextensible sans masse de longueur l,sujette à un champ de gravitation uniforme −mg, et contrainte à se mouvoirle long d’un arc de cercle. On appelle θ son angle d’oscillation.

    Afin de spécifier les forces s’exerçant sur le balancier du pendule, dont onsuppose que c’est une masse ponctuelle, on décompose la force totale dansses composantes. Choisissons la direction du fil comme axe des ordonnées etla tangente à l’arc de cercle décrit par le balancier à l’endroit du balanciercomme axe des abscisses. La composante de la force dans la direction del’accélération du balancier est mgsinθ. La longueur s de l’arc de cercleparcourue par le balancier à un certain instant, c’est-à-dire sa distance àl’origine, est donnée par s = lθ. L’équation du mouvement du balancierdevient alors :

    − gsinθ = l d2θ

    dt2(1.10)

    Cette équation permet de vérifier que la période du pendule est proportion-nelle à la racine carrée de sa longueur et indépendante de sa masse, commel’avaient observé Galilée et Newton.

    l

    m

    -mgmg sin !

    !

    Figure 1.3. Pendule simple.

    Notons que l’équation du mouvement n’a pas ici la forme simple de laloi de Hooke : l’expression de la force est dépendante du sinus de l’angle.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 23 — #27 ✐✐

    ✐✐

    ✐✐

    1.2 Formulation newtonienne 23

    Pour ce type de système, l’usage de coordonnées polaires est parfois plusavantageux que celui de coordonnées rectangulaires 29.

    Comme le montrent les exemples du système masse-ressort et du pen-dule simple, l’application de la deuxième loi de Newton à la résolution deproblèmes exige des compétences qui dépassent la seule capacité à opérerdes déductions mathématiques au moyen d’équations différentielles : dansles deux cas, écrire la loi sous la forme adéquate exige d’être capable dereprésenter le problème – souvent en s’aidant d’un schéma – de façon àpouvoir identifier les forces pertinentes et à choisir les coordonnées les plusadaptées.

    Remarque : la notion de modèle Les systèmes représentés dans lesfigures 1.1 et 1.3 sont des systèmes idéaux : la masse m est supposéeponctuelle, et le ressort comme le fil du pendule sont supposés ne pasavoir de masse ; il n’y a ni frottements, ni résistance de l’air, et le champ degravitation est supposé uniforme. L’application de la loi de Hooke à un ressortréel nécessite des hypothèses simplificatrices ou idéalisations qui conduisentà représenter ce ressort comme un ressort idéal. On appelle couramment cessystèmes idéaux qui satisfont parfaitement les lois fournies par la théoriedes « modèles ». On retrouvera, aux chapitres 2 et 3, la notion de modèle,qui fait l’objet de nombreux débats en philosophie des sciences. Insistonscependant dès à présent sur la chose suivante : on peut dire que les systèmesidéaux présentés ci-dessus sont à la fois des modèles de la théorie et desmodèles des systèmes physiques réels. En effet, en tant qu’ils ont la formed’un système concret (un ressort, un pendule), ces modèles permettent auxagents de se représenter ce que disent les lois de la mécanique au moyen d’unsystème (imaginaire) qui y obéirait parfaitement. Autrement dit, et pouremployer un langage métaphorique, tout en étant imaginaires, ces modèlespermettent de donner de la chair aux lois encore abstraites en se les figurant.En ce sens, ils sont des modèles de la théorie, qu’ils permettent d’illustrer.

    En outre, dans la mesure où l’application des hypothèses de la théorie auxphénomènes peut être décrite comme une opération consistant à représenter,par exemple, un ressort réel comme un ressort idéal, ce dernier est aussi unmodèle du ressort réel, au sens où il en est une représentation, qui porteen elle une hypothèse théorique. En apprenant à prédire le comportementd’un tel système idéal, on apprend à identifier et à représenter les forces en

    29On passe de coordonnées rectangulaires en coordonnées polaires par la transformationsuivante : x = rcosθ et y = rsinθ. Sans que cela affecte les prédictions, la forme de la loide Newton change avec un tel changement de coordonnées. Comme on va le voir, ce nesera pas le cas avec les équations des formulations analytiques. Pour plus de détail sur cepoint, voir North, 2009a, pp. 12-15.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 24 — #28 ✐✐

    ✐✐

    ✐✐

    24 Chapitre 1. Formulations de la mécanique classique

    présence dans un système réel de telle sorte qu’il devient possible d’utiliserla loi de Hooke pour en prédire le comportement 30.

    Limites pratiques de la formulation newtonienne

    Les différentes opérations décrites ci-dessus (identification des forces enprésence, écriture des équations, résolution des équations) s’avèrent parfoisdifficiles, voire impossibles à effectuer. Pour certains systèmes, c’est l’étapede la mise en équation qui est pratiquement impossible ; dans d’autres cas,c’est la résolution des équations qui pose problème, car certaines équationsainsi obtenues n’ont pas de solution analytique (c’est-à-dire qu’elles ne sontpas intégrables). Dans ce qui suit, je présente un exemple typique de systèmeque la formulation newtonienne ne permet pas, en pratique, de décrire, etqui motive l’introduction des formulations analytiques.

    Dans certains cas, l’utilisation du principe fondamental de la dynamiques’avère pratiquement impossible. Spécifier les forces s’exerçant entre les parti-cules d’un système afin d’écrire les équations du mouvement correspondantesn’est pas une opération qui va de soi ; pour certains systèmes, on rencontreà cette étape des difficultés insurmontables. C’est le cas de la plupart dessystèmes mécaniques soumis à ce que l’on appelle des « contraintes » ou« liaisons ».

    Un système contraint est un système dont les particules ne sont pas libres.Il existe dans la plupart des systèmes physiques des liaisons entre particulesqui les empêchent de se mouvoir librement indépendamment les unes desautres. Contrairement à ce qui est le cas pour un système de n particuleslibres, un système contraint n’a pas 6n degrés de liberté. L’exemple le plussimple d’un système contraint est celui d’un corps rigide, où les contraintessur les particules sont telles que les distances entre elles restent inchangées.D’autres exemples peuvent être fournis, comme celui des boules d’un bouliercontraintes à un mouvement unidimensionnel, celui des molécules de gaz àl’intérieur d’un récipient, contraintes à se mouvoir uniquement à l’intérieurde ce récipient, celui d’une particule placée à la surface d’un solide sphérique,contrainte à ne se mouvoir qu’à la surface ou dans la région extérieure àla sphère, ou encore celui de deux pendules liés et contraints à se déplacerdans un plan (figure 1.4) 31. On distingue différents types de contraintes

    30Sur la notion de modèle, voir Nagel, 1961 (auquel le chapitre 2 consacre un long dé-veloppement), Black, 1962, Hesse, 1966. Pour des références plus récentes, voir Giere,1988, Cartwright, 1999, Morgan et Morrison, 1999, Frigg, 2002, 2006, Suárez, 1999, 2003,Godfrey-Smith, 2006.

    31Lanczos (1970, pp. 10-11) propose cette liste d’exemples de systèmes contraints et de leurnombre de degrés de liberté :

    Un degré de liberté : un piston se mouvant de haut en bas. Un corps rigide en rotationautour d’un axe fixe.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 25 — #29 ✐✐

    ✐✐

    ✐✐

    1.2 Formulation newtonienne 25

    !1

    !2

    l2

    l1

    m2

    m1

    Figure 1.4. Deux pendules liés, contraints à se déplacer dans un plan.

    (voir l’annexe E). Notons simplement que les contraintes dites « holonomes »,auxquelles je m’intéresserai presque exclusivement, sont celles qui peuventêtre exprimées au moyen d’équations reliant les coordonnées des particuleset le temps ayant pour forme :

    f(r1, r2, r3, ...t) = 0 (1.11)

    Les contraintes introduisent deux types de difficultés dans la résolutiondes problèmes de mécanique selon l’approche newtonienne :

    1. les coordonnées ri des particules ne sont pas indépendantes les unesdes autres ; les équations du mouvement ne le sont par conséquent pasnon plus ;

    2. les forces de contrainte ne sont pas données. Elles figurent parmi lesinconnues du problème. Comme le dit Herbert Goldstein, « imposerdes contraintes au système est simplement une autre manière de direqu’il y a des forces présentes dans le problème qui ne peuvent êtrespécifiées directement mais dont on a connaissance par leur effet sur lemouvement du système » (Goldstein, 1950/2002, chap. 1, p. 13). Celan’empêche pas d’écrire les équations du mouvement : on peut traiter lescontraintes en laissant les forces de liaison indéterminées. Cependant,

    Deux degrés de liberté : une particule se mouvant sur une surface donnée.Trois degrés de liberté : une particule se mouvant dans l’espace. Un corps rigide en

    rotation autour d’un point fixe.Quatre degrés de liberté : deux composantes d’une étoile double en révolution sur le

    même plan.Cinq degrés de liberté : deux particules maintenues à une distance constante l’une de

    l’autre.Six degrés de liberté : deux planètes en révolution autour d’un soleil fixe. Un corps

    rigide se mouvant librement dans l’espace.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 26 — #30 ✐✐

    ✐✐

    ✐✐

    26 Chapitre 1. Formulations de la mécanique classique

    l’élimination des forces de liaison fait alors partie du problème derésolution des équations.

    Comme on va le voir maintenant, la formulation lagrangienne de lamécanique permet de surmonter ces deux difficultés.

    1.3 Formulations analytiques : la formulation lagrangienne

    Les formulations analytiques permettent d’étudier de nombreux phénomènesque la mécanique newtonienne ne peut pas traiter, comme, par exemple, lemouvement des fluides. Les exposés des principes de la mécanique analytiquemotivent souvent la présentation de cette approche des phénomènes dumouvement par le constat des limites d’applicabilité de la formulation newto-nienne 32. Les outils mathématiques et les grands principes de la mécaniqueanalytique peuvent être présentés comme une réponse à la double difficultéque posent les systèmes contraints, telle qu’elle a été dégagée à la fin de lasection précédente.

    Les formulations lagrangienne et hamiltonienne sont toutes deux desformulations analytiques. Elles se distinguent entre autres par le type decoordonnées qu’elles utilisent pour représenter l’état des systèmes. Je neprésente dans ce chapitre que la formulation lagrangienne, dont plusieursaspects sont communs à la formulation hamiltonienne. Le lecteur trouveraen annexe une présentation brève des caractéristiques essentielles de laformulation hamiltonienne (annexe L).

    Dans ce qui suit, je présente d’abord (section 1.3.1) les outils mathéma-tiques au moyen desquels les formulations analytiques représentent l’étatdes systèmes mécaniques. La différence entre ces outils et ceux qui sontmis en œuvre par la mécanique newtonienne est cruciale pour mon propos ;elle est au cœur de l’analyse de la section 1.4 du présent chapitre. Ensuite(sections 1.3.2 et 1.3.3), j’expose brièvement – sans entrer dans le détaildes déductions, que le lecteur trouvera en annexe – les différents principes(principe de d’Alembert et principe de Hamilton ) qui permettent de déduireles équations lagrangiennes du mouvement. On verra que ces principes, dé-ductibles des principes newtoniens, mettent en jeu des concepts différents(énergies cinétique et potentielle, travail) 33 de celui qui est au fondementde la mécanique newtonienne (force). Enfin (section 1.3.4), je présenterai

    32Signalons qu’en outre, la forme des équations lagrangiennes se retrouve en théorie deschamps et en relativité et celle des équations hamiltoniennes en mécanique statistique etquantique. Présenter cela en détail m’éloignerait du cœur de mon propos. Mon exposévise uniquement à mettre en évidence les différences entre ces formulations pour des cassimples.

    33Historiquement, ces concepts ont été introduits après la formulation des principes de lamécanique analytique. Cependant, dans sa formulation contemporaine, le principe de

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 27 — #31 ✐✐

    ✐✐

    ✐✐

    1.3 Formulation lagrangienne 27

    la manière dont les équations lagrangiennes du mouvement peuvent êtreutilisées pour résoudre des problèmes mécaniques.

    1.3.1 Outils mathématiques de la représentation des systèmes mécaniques :espace de configuration et coordonnées généralisées

    Les outils mathématiques utilisés pour représenter les systèmes en mécaniqueanalytique peuvent être décrits comme une manière de répondre à la premièredifficulté énoncée à la fin de la section 1.2.3 (page 25). La clef de la solutionréside dans une des idées fondamentales de l’approche analytique, celled’un espace de configuration à n dimensions dans lequel la configurationdu système entier est représentée par un point, dont les coordonnées sontappelées « coordonnées généralisées » et sont au nombre de n, correspondantau nombre de degrés de liberté des particules du système. Les coordonnéesgénéralisées d’un espace de configuration n’ont pas forcément, comme on vale voir, la dimension de positions.

    Considérons un système mécanique de N particules. Si ces particulessont libres de contrainte, le système a 3N coordonnées indépendantes oudegrés de liberté. Dans ce cas, l’espace de configuration coïncide avec l’espacetridimensionnel où la position de chaque particule est déterminée par troiscoordonnées. S’il existe des contraintes holonomes, exprimées par k équationsde la forme de l’équation (1.11), on peut éliminer à l’aide de ces équationsk des 3N coordonnées. Il est alors possible de caractériser la configurationdu système par n = 3N − k variables indépendantes q1, q2, ..., qN , appelées« coordonnées généralisées » 34, en fonction desquelles les coordonnées rec-tangulaires de position r1, r2, ..., rN sont exprimées par des équations quicontiennent implicitement les contraintes. Cela signifie que, contrairement àce qui est le cas dans le cadre de la formulation newtonienne, qui représen-terait ce système avec les 3N coordonnées de position et devrait spécifierexplicitement les équations des forces qui maintiennent les contraintes entreles particules (ou alors se trouverait confrontée au problème de devoir élimi-ner les forces de liaison laissées indéterminées pour résoudre les équations),

    Hamilton met en jeu ces concepts. Pour une histoire du concept d’énergie, voir Harman,1982b et Darrigol, 2001.

    34Il y a une ambiguïté dans l’usage de l’expression « coordonnées généralisées » : au sensstrict, elle désigne ce que l’on pourrait appeler les « positions généralisées » ; en ce sens,les coordonnées généralisées sont au nombre de n pour un système à n degrés de liberté.Parfois, l’expression désigne, en un sens plus large, l’ensemble formé par les positions etles vitesses généralisées ; en ce dernier sens, elles sont alors au nombre de 2n pour unsystème à n degrés de liberté.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 28 — #32 ✐✐

    ✐✐

    ✐✐

    28 Chapitre 1. Formulations de la mécanique classique

    on n’a pas besoin de connaître ces forces pour représenter la configurationdu système 35.

    Les transformations de coordonnées 36 conduisant aux n coordonnéesgénéralisées du système ont la forme suivante :

    x1 = f1(q1, ..., q3N ), (1.12)... = ...... = ...

    zN = f3N (q1, ..., q3N ).

    De même que l’on associe aux trois nombres x, y et z un point dans unespace tridimensionnel, on associe aux n nombres q1, q2, ..., qn un point Pdans un espace à n dimensions. De même, si l’on peut associer une courbeet le mouvement d’un point le long de cette courbe aux équations

    x = f(t) (1.13)y = g(t)z = h(t)

    on considère que les équations correspondantes

    q1 = q1(t) (1.14)... = ...... = ...qn = qn(t)

    représentent la solution d’un problème dynamique : leurs solutions donnentles coordonnées d’un point P dans un espace à n dimensions en mouvementle long d’une courbe donnée de cet espace, qui représente l’état du système

    35Si la contrainte est non holonome (voir l’annexe E), les équations qui l’expriment nepeuvent être utilisées pour éliminer les coordonnées dépendantes. L’exemple d’un objetroulant sur une surface sans glissemement le montre : la condition de roulement est unecondition différentielle qui ne peut être donnée sous forme intégrée qu’après résolution duproblème. On peut toujours, si la contrainte est non intégrable, introduire les équationsdifférentielles de liaison dans le problème en même temps que les équations différentielles dumouvement et éliminer les équations dépendantes, par la méthode dite des « multiplicateursde Lagrange » (voir Lanczos, 1970, pp. 43-48 et, pour une analyse de l’interprétationphysique de cette méthode, Butterfield, 2004, pp. 46-49). Cependant, je supposerai presquetoujours dans mon exposé que les contraintes sont holonomes ; cette restriction est sanseffet sur mon propos.

    36La représentation de l’état – ou configuration – d’un système à l’aide de coordonnéesgénéralisées est une généralisation de l’idée de changement de coordonnées (comme dans lecas du passage de coordonnées rectangulaires x, y, z, à des coordonnées polaires r, θ, φ).

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 29 — #33 ✐✐

    ✐✐

    ✐✐

    1.3 Formulation lagrangienne 29

    étudié. Par exemple, la position d’un corps rigide est symbolisée par un seulpoint dans un espace à six dimensions. Les diverses positions du corps sontreprésentées par des points de cet espace.

    Une des caractéristiques de la mécanique analytique est de ne pas spécifierle type de coordonnées utilisé pour représenter le mouvement d’un système :n’importe quel ensemble de paramètres qui permet de caractériser la positiond’un système mécanique peut être choisi comme système de coordonnées.Comme on va le voir, cela a pour conséquence importante le fait que leséquations de la mécanique analytique sont indépendantes du système decoordonnées dans lesquelles elles sont formulées. Cela permet, entre autreschoses, de relier la dynamique avec des géométries d’espace à plusieursdimensions 37.

    1.3.2 Principe de d’Alembert et équations de Lagrange

    Rappelons à présent la seconde difficulté présentée par les systèmes contraints(voir page 25) : les forces de contrainte font partie des inconnues du problème.Il faut donc trouver un moyen de représenter la dynamique des systèmes quiautorise à se passer des forces de contrainte. Le principe du travail virtuel,généralisé de la statique à la dynamique par le principe de d’Alembert, rendcela possible. On va voir que les équations du mouvement de Lagrange,équations fondamentales de l’approche analytique de la mécanique, en sontdéductibles. Le principe de d’Alembert n’est pas en tant que tel un principevariationnel (comme les différentes formes du principe de moindre action,que je présenterai ensuite), c’est-à-dire qu’il n’implique pas la minimisationd’une intégrale, mais on verra que les différents principes fondamentaux del’approche analytique de la mécanique sont déductibles les uns des autres.

    Principe du travail virtuel

    Le principe du travail virtuel 38 est un principe de la statique : il énonceune condition pour l’équilibre des systèmes contraints. Le travail W d’uneforce F s’appliquant à une particule en mouvement du point 1 au point 2 estdéfini par W12 =

    � 21 F · ds. Appelons déplacement virtuel δri d’un point i

    tout changement infinitésimal de la position de ce point compatible avec lescontraintes 39. Le principe du travail virtuel affirme qu’un système est en

    37Voir Lanczos, 1970, pp. 17-24.38Ce principe est dû à Jean Bernouilli et à d’Alembert (1743), qui ont élargi les principes

    de l’équilibre énoncés, entre autres, par Stévin, aux système à liaisons. Pour un exposéplus complet de ce principe, voir Lanczos, 1970, pp. 75-78 et Darrigol, 2007, pp. 763-766.

    39La notation δ pour indiquer une variation (d’une quantité quelconque, et non pas seulementde la position) possible, ou virtuelle, par opposition à une variation actuelle notée d, a étéintroduite par Lagrange.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 30 — #34 ✐✐

    ✐✐

    ✐✐

    30 Chapitre 1. Formulations de la mécanique classique

    équilibre si et seulement si, pour tout déplacement virtuel δri du point ri,la somme des travaux virtuels des forces qui s’y appliquent (Fi) est nulle.

    i

    Fi · δri = 0 (1.15)

    Les forces dont il s’agit n’incluent pas les forces de liaison : le principe dutravail virtuel énonce une condition pour l’équilibre d’un système contrainten se passant des forces qui maintiennent les contraintes. En tant quetel, il repose sur une restriction à ce que Jeremy Butterfield appelle descontraintes « idéales » (Butterfield, 2004, p. 44), c’est-à-dire des contraintestelles que les forces qui les maintiennent ne produiraient aucun travail lorsd’un déplacement virtuel. Les systèmes contraints – ou systèmes à liaison –sont définis comme des systèmes pour lesquels tout déplacement virtuel estréversible et dont une force arbitrairement faible appliquée dans la directiond’un déplacement possible suffit à briser l’équilibre (voir Darrigol, 2007,p. 763). Cette restriction exclut, entre autres, les forces de frottement 40.

    Principe de d’Alembert

    Le principe du travail virtuel satisfait nos besoins en ce qu’il ne contientpas les forces de liaison, mais il n’est valable qu’en statique. Le principe ded’Alembert est une extension de ce principe à la dynamique. Comme on vale voir, les équations lagrangiennes du mouvement en sont déductibles.

    Le procédé qui permet le passage de la statique à la dynamique ou, si l’onveut, la réduction de la dynamique à la statique, consiste à traiter l’opposédu produit ma comme une force. On réécrit alors le principe fondamentalde la dynamique (F = ma) sous la forme :

    F − ma = 0 (1.16)

    On sait que l’annulation d’une force dans la mécanique newtonienne impliquel’équilibre. L’équation (1.16) affirme donc que l’addition de la force −ma,appelée « force d’inertie », aux autres forces agissantes produit l’équilibre.Cela signifie que tout système de forces est en équilibre si on ajoute auxforces appliquées les forces d’inertie 41. Si l’on est en possession d’un critèrepour l’équilibre d’un système mécanique, on peut alors étendre ce critère à

    40Lanczos présente cette restriction comme le postulat fondamental de la mécanique analy-tique et le baptise « postulat A » (Lanczos, 1970, pp. 76-77). En effet, dès lors qu’il estétendu aux systèmes dynamiques par le principe de d’Alembert, il permet de déduire lesprincipes variationnels fondamentaux de la mécanique analytique.

    41Pour une analyse des hypothèses qui sous-tendent le principe de d’Alembert, voir Darrigol,2007, pp. 771-773.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 31 — #35 ✐✐

    ✐✐

    ✐✐

    1.3 Formulation lagrangienne 31

    un système en mouvement. Il suffit en effet d’ajouter la force d’inertie auxforces en présence.

    Combiné au principe du travail virtuel, le principe de d’Alembert permetd’affirmer que la somme des travaux virtuels des forces appliquées et des forcesd’inertie s’annule pour tout déplacement compatible avec les liaisons δri :

    �(Fi − miai) · δri = 0 (1.17)

    Insistons sur le fait que les forces de liaison ne figurent pas dans ceprincipe (les Fi ne comprennent pas les forces de liaison). Dans les casoù la trajectoire virtuelle coïncide avec la trajectoire réelle, le principe ded’Alembert permet de déduire le théorème de conservation de l’énergie 42.Pour mon propos, l’aspect le plus important du principe de d’Alembert estqu’il permet de déduire les équations lagrangiennes du mouvement.

    Les équations de Lagrange. Les concepts d’énergies cinétique et

    potentielle et de travail

    En mécanique lagrangienne, la dynamique des systèmes est entièrementgouvernée par un ensemble d’équations, appelées « équations de Lagrange »ou « équations lagrangiennes ». Elles sont donc les analogues, dans cetteformulation de la mécanique, des équations newtoniennes, dont on a vuqu’elles avaient la forme du principe fondamental de la dynamique.

    Les équations lagrangiennes, dont on verra plus loin qu’elles sont dé-ductibles du principe de Hamilton – lui-même déductible du principe ded’Alembert –, sont des conséquences du principe de d’Alembert. Leur dé-duction repose sur l’expression du principe de d’Alembert (équation 1.17) àl’aide de coordonnées généralisées et sur la restriction à des systèmes holo-nomes. Une chaîne de déductions mathématiques 43 conduit aux équationssuivantes :

    d

    dt

    �∂T

    ∂q̇i

    �− ∂T

    ∂qi= Qi (1.18)

    où T désigne ce que l’on appelle l’« énergie cinétique du système », définiepar T = 12 mv

    2, et où Qi représente les composantes d’un vecteur de l’espacede configuration à n dimensions, que l’on appelle la « force généralisée », etqui suffit à représenter l’action dynamique de toutes les forces appliquées ausystème (de même que le mouvement du système peut être représenté commele mouvement d’une particule unique dans cet espace à n dimensions).

    42Voir l’annexe F et, pour plus de détails, Lanczos, 1970, pp. 94-96. Pour l’examen détaillédes conséquences du principe de d’Alembert, voir Lanczos, 1970, pp. 94-110.

    43La déduction, exposée en détail par Butterfield, 2004, pp. 51-53 et par Goldstein, 1950/2002,pp. 16-21, est reproduite à l’annexe G.

  • ✐✐

    “000PpalVorms” — 2011/8/16 — 14:35 — page 32 — #36 ✐✐

    ✐✐

    ✐✐

    32 Chapitre 1. Formulations de la mécanique classique

    Dans le cas des forces que l’on appelle « conservatives » 44, le travailtotal effectué par la force Qi au cours d’un mouvement ne dépend que de laposition des points extrêmes et non de la trajectoire particulière effectivementsuivie 45. Il devient alors possible d’exprimer le travail W comme la variationd’une quantité qui dépend seulement de la position des points terminaux.Cette quantité peut être notée −V , de telle sorte que l’on a la relationQi = − ∂V∂qi . V désigne ce que l’on appelle l’« énergie potentielle » du systèmedans le champ de force Qi.

    On définit alors une fonction L, appelée « lagrangien », telle que L =T − V , qui permet de reformuler les équations (1.18) comme suit :