dimitris koukoulopoulos université de montréal · 2017. 12. 18. · 10 chapitre 1. la structure...

150
Introduction à la théorie des nombres Dimitris Koukoulopoulos Université de Montréal Dernière mise-à-jour : 18 décembre 2017

Upload: others

Post on 01-Nov-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Introduction à la théorie des nombres

Dimitris Koukoulopoulos

Université de MontréalDernière mise-à-jour : 18 décembre 2017

Page 2: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2

Page 3: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Table des matières

I Méthodes algébriques 7

1 La structure multiplicative des entiers 91.1 Divisibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2 Le plus grand commun diviseur . . . . . . . . . . . . . . . . . . . . . . . . . 101.3 Le plus petit commun multiple . . . . . . . . . . . . . . . . . . . . . . . . . . 141.4 Nombres premiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.5 Fonctions multiplicatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2 Arithmétique modulaire 252.1 Congruences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.2 Critères de divisibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.3 Le théorème de Wilson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.4 Le théorème des restes chinois . . . . . . . . . . . . . . . . . . . . . . . . . . 322.5 Équations polynomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3 Éléments de la théorie des groupes 513.1 Le concept d’un groupe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.2 Sous-groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523.3 Génération de groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 533.4 L’ordre d’un élément . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.5 L’exposant d’un groupe abélien . . . . . . . . . . . . . . . . . . . . . . . . . 563.6 Groupes isomorphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583.7 Le groupe quotient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4 Le groupe (Z/nZ)∗ 634.1 Racines primitives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634.2 Résidus quadratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.3 Caractères . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5 Équations diophantiennes 815.1 Une équation diophantienne linéaire . . . . . . . . . . . . . . . . . . . . . . . 815.2 Triplets pythagoriciens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825.3 Équations diophantiennes insolubles . . . . . . . . . . . . . . . . . . . . . . . 835.4 Sommes de deux carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 865.5 Sommes de quatre carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

3

Page 4: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4 TABLE DES MATIÈRES

II Méthodes analytiques 95

6 Et il en exista infiniment beaucoup 97

7 Estimations asymptotiques 997.1 La notation asymptotique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 997.2 Une preuve analytique de l’infinité des premiers . . . . . . . . . . . . . . . . 1017.3 Sommation par parties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

8 La convolution de Dirichlet 1098.1 La méthode de l’hyperbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1098.2 Les théorèmes de Chebyshev et de Mertens . . . . . . . . . . . . . . . . . . . 113

9 La fonction zeta de Riemann 119

10 Le théorème d’Erdős-Kac 125

III Méthodes transcendantales 131

11 Nombres irrationnels et transcendantaux 133

12 Fractions continues 139

Page 5: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Notation

Les symboles N,Z,Q,R et C dénotent les ensembles des nombres naturels, entiers, ra-tionnels, réels et complexes, respectivement. On n’inclut pas le nombre 0 à l’ensemble denombres naturels.

Le symbole log x dénote toujours le logarithme naturel de x (qui est souvent noté parlnx dans la bibliographie).

Étant donné un ensemble A ⊂ C, on dénote par A[x] l’ensemble des polynômes f(x) =a0 + a1x + · · · + adx

d dont les coefficients a0, a1, . . . , ad appartiennent à A. Étant donné unpolynôme f(x) ∈ C[x] qui n’est pas égal à 0, on peut toujours l’écrire uniquement commef(x) = a0 + a1x+ · · ·+ adx

d, où ad 6= 0. Le nombre d est appelé le degré de f .

Étant donné un nombre réel x, on utilise la notation bxc pour dénoter sa partie entier,qui est défini d’être le plus grand entier n qui est plus petit que x, c’est-à-dire

bxc = maxn ∈ Z : n ≤ x.

De plus, on utilise la notation x pour dénoter la partie fractionnel de x, qui est défini par

x = x− bxc .

On remarque ici que la partie entier de x est l’entier unique n satisfaisant les inégalitésn ≤ x < n + 1. Une autre propriété de la partie entier qu’on utilisera beaucoup est que six > 0, alors

bxc = #n ∈ Z : 1 ≤ n ≤ x.

La lettre p dénote toujours un nombre premier (définition 1.25). La notation a|b veutdire que a divise b (définition 1.1). Si p est un nombre premier et v ∈ N, alors on écrit pv‖nsi pv|n et pv+1 - n.

La notation (a, b) pourrait signifier le plus grand commun diviseur de a et b (définition1.4), l’intervalle ouvert dont les limites sont a et b (c’est-à-dire l’ensemble x ∈ R : a < x <b), ou le pair de nombres a et b. Le contexte déterminera sa signification.

De même, le symbole [a, b] pourrait signifier le plus petit commun multiple de a et b(définition 1.20) ou l’intervalle fermé dont les limites sont a et b (c’est-à-dire l’ensemblex ∈ R : a ≤ x ≤ b).

5

Page 6: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

6 TABLE DES MATIÈRES

Page 7: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Première partie

Méthodes algébriques

7

Page 8: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons
Page 9: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 1

La structure multiplicative des entiers

1.1 DivisibilitéDéfinition 1.1. Soit a, b ∈ Z avec a 6= 0. On dit que a divise b et on écrit a|b si b/a ∈ Z,c’est-à-dire si il existe k ∈ Z tel que b = ka.

Dans ce cas, on dit aussi que b est divisible par a, ou que a est un diviseur de b ou que best un multiple de a.

Le lemme suivant établit quelques propriétés de base de la notion de la divisibilité :

Lemme 1.2. Soit a, b ∈ Z avec a 6= 0.(a) Si a|b, alors soit b = 0 soit |b| ≥ a.(b) Si a|b et a|c, alors a|(bx+ cy) pour tout x, y ∈ Z.(c) Si a|b et c|d, alors ac|bd.(d) Si a|b et b|c, alors a|c.(e) Si c 6= 0 et ac|bc, alors a|b.

On nombre ne divise pas toujours un autre. Par exemple, 3|6 mais 3 - 7. En général, ona le théorème suivant.

Théorème 1.3 (Division euclidienne). Soit a, b ∈ Z avec a 6= 0. Il existe q, r ∈ Z uniquestels que

b = qa+ r et 0 ≤ r < |a|.Les nombres q et r sont appelés le quotient et le reste de la division de b par a, respectivement.

Démonstration. Puisque qa = (−q)(−a) et | − a| = |a|, on peut supposer, sans perte degénéralité, que a ≥ 1.

On commence en prouvant l’existence de q et de r. On considère les nombres nj := b−ja,j ∈ Z. Observons que nj+1 − nj = −a, c’est-à-dire les nombres nj sont une progressionarithmétique d’étape a. Donc il existe j0 ∈ Z tel que nj0 ∈ [0, a). (Sinon, on pourrait trouverj tel que nj+1 < 0 et nj ≥ a et, par la suite, nj − nj+1 > a, ce qui est impossible.) On poser = nj0 ∈ [0, a) et on observe que b = j0a+ nj0 . Donc l’existence de q et r découle en posantq = j0 et r = nj0 .

9

Page 10: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

Finalement, on montre l’unicité de q et r. Supposons que b = qa + r = q′a + r′ avec0 ≤ r, r′ < a. Donc

(q − q′)a = r′ − r,

ce qui implique que a|r′ − r. Cependant |r′ − r| < a par notre hypothèse que 0 ≤ r, r′ < a.Donc lemme 1.2(a) implique que r′ = r. Donc on trouve que (q− q′)a = 0 et, puisque a ≥ 1,alors q′ = q aussi.

Exercices

Exercice 1.1. Soit a, b ∈ N. Montrez que a = b si et seulement si a|b et b|a.

Exercice 1.2. Soient a, b ∈ N tels que 1/a+ 1/b est entier. Montrez que soit a = b = 1 soita = b = 2.

1.2 Le plus grand commun diviseurAfin d’étudier la relation multiplicative de deux nombres, on introduit la notion de leur

plus grand commun diviseur :

Définition 1.4. Soient a, b ∈ Z qui ne sont pas les deux égaux à 0. Le plus grand commundiviseur de a et b, dénoté par (a, b), est défini d’être le plus grand nombre naturel qui divisea et b. C’est-à-dire

(a, b) = maxd ∈ N : d|a et d|b.

Remarque 1.5. Notre hypothèse que soit a 6= 0 soit b 6= 0 implique que l’ensemble d ∈N : d|a et d|b est non-vide et fini. Donc (a, b) est bien défini.

On peut utiliser un algorithme rapide pour calculer le plus grand commun diviseur dedeux nombres qui se base sur la division euclidienne. L’observation-clé est donnée au lemmesuivant :

Lemme 1.6. Pour tout a, b, q ∈ Z avec a 6= 0, on a que (a, b) = (a, b− qa). En particulier,si r est le reste dans la division de b par a, on a que (a, b) = (a, r).

Démonstration. Si d|a et d|b, alors d|b − qa aussi. Réciproquement, si d|a et d|b − qa, alorsd|qa+ (b− qa) = b. Donc on trouve que

d ∈ N : d|a et d|b = d ∈ N : d|a et d|b− qa,

ce qui termine la démonstration.

Ce lemme nous amène à l’algorithme euclidien pour calculer le plus grand commun diviseurde deux nombres. Soient a, b ∈ N. Sans perde de généralité, on suppose que b ≥ a. On écritb = qa + r avec 0 ≤ r < a pour que (a, b) = (a, r), ce qui nous permet de remplacer le pair(a, b) avec un nouveau par, (a, r), dont le plus petit élément est strictement plus petit qu’on

Page 11: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

1.2. LE PLUS GRAND COMMUN DIVISEUR 11

avait avant. Bien sûr, on peut répéter cette procedure : on a que a = q′r+ r′ avec 0 ≤ r′ < ret que (a, r) = (r′, r), ce qui nous permet de remplace le pair (a, r) avec le nouveau pair(r′, r) pour que minr, r′ = r′ < r = mina, r. En continuant dans cette façon, on doitarriver à un pair dont un de deux membres est égal à 0. Le terme non-zéro du premier telpair serait le plus grand commun diviseur de a et b. Plus formellement, il existe un n tel que

b0 := b, b1 := a, b0 = q1b1 + r1, 0 < r1 < b1

(a, b) = (b0, b1) = (b1, r1)

b2 := r1 < b1, b1 = q2b2 + r2, 0 < r2 < b2

(a, b) = (b1, b2) = (b2, r2)

b3 := r2 < b2, b2 = q3b3 + r3, 0 < r3 < b3

(a, b) = (b2, b3) = (b3, r3)

...bn−1 := rn−2 < bn−2, bn−2 = qn−1bn−1 + rn−1, 0 < rn−1 < bn−1

(a, b) = (bn−2, bn−1) = (bn−1, rn−1)

bn := rn−1 < bn−1, bn−1 = qnbn + rn, rn = 0

(a, b) = (bn−1, bn) = (bn, 0) = bn.

Exemple 1.7. Calculons (91, 65). On a que

91 = 1 · 65 + 26 (91, 65) = (65, 26)

65 = 2 · 26 + 13 (91, 65) = (65, 26) = (26, 13)

26 = 2 · 13 (91, 65) = (26, 13) = (13, 0) = 13.

Exemple 1.8. Calculons (1568, 686). On a que

1568 = 2 · 686 + 196 (1586, 686) = (686, 196)

686 = 3 · 196 + 98 (1586, 686) = (686, 196) = (196, 98)

196 = 2 · 98 (1586, 686) = (196, 98) = (98, 0) = 98.

L’algorithme euclidien nous permet de déduire le théorème suivant qui est très utile.

Théorème 1.9. Soient a, b ∈ Z qui ne sont pas les deux égaux à zéro. Alors, le plus grandcommun diviseur de a et b est une combinaison linéaire de a et b, c’est-à-dire il existe deuxentiers x et y tels que

(a, b) = ax+ by.

Démonstration. Le cas où a = 0 ou b = 0 est facile. Supposons maintenant que a et b nesont pas zéro. Sans perde de généralité, on peut supposer que a, b ∈ N. Donc, en utilisant lanotation au-dessus, on a que (a, b) = bn, où

b0 = q1b1 + b2, b1 = q2b2 + b3, b2 = q3b3 + b4, . . . bn−2 = qn−1bn−1 + bn,

Avec b0 = b et b1 = a. (a, b) = bn = bn−2 − qn−1bn−1 est une combinaison linéaire de bn−1 etde bn−2. Puisque bn−1 = bn−3 − qn−2bn−2 est une combinaison linéaire de bn−2 et de bn−3, on

Page 12: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

12 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

trouve que (a, b) a la même propriété. On continue en remplaçant bn−2 par bn−4 − qn−3bn−3pour trouver que (a, b) est une combinaison linéaire de bn−3 et de bn−4. De façon inductive,on conclut que (a, b) est une combinaison linéaire de b0 et de b1, comme affirmé.

Remarque 1.10. La dernière démonstration nous permet de trouver les nombres x et y, sion sait les restes q1, q2, . . . , qn−1 qui apparait dans l’algorithme euclidien. En effet, on a que

(a, b) = bn = bn−2 − qn−1bn−1= bn−2 − qn−1(bn−3 − qn−2bn−2)= (1 + qn−1qn−2)bn−2 − qn−1bn−3= (1 + qn−1qn−2)(bn−4 − qn−3bn−3)− qn−1bn−3= (1 + qn−1qn−2)bn−4 − [(1 + qn−1qn−2)qn−3 + qn−1]bn−3

= · · · = ax+ by.

On applique cet algorithme aux paires des exemples 1.7 et 1.8 au-dessous. On a que

(91, 65) = 13 = 65− 2 · 26

= 65− 2 · (91− 1 · 65) = −2 · 91 + 3 · 65.

De même, on a que

98 = (1586, 686) = 686− 3 · 196

= 686− 3 · (1586− 2 · 686) = −3 · 1586 + 7 · 686.

Remarque 1.11. L’algorithme euclidien est un algorithme très rapide. Supposons que 1 ≤a ≤ b et que a - b, pour que n ≥ 2. Pour tout m ∈ 0, 1, . . . , n − 2, on a que bm =qm+1bm+1 + bm+2. Aussi, on sait que bm+1 ≥ bm+2 et que qm+1 ≥ 1. Donc bm ≥ 2bm+2. Unargument itératif montre que b2k ≤ b2/2

k ≤ a/√

22k

et que b2k−1 ≤ b1/2k−1 =

√2a/√

22k−1

,pour tout k ≥ 1. En particulier, on a que 1 ≤ bn−1 ≤

√2a/√

2n−1

, ce qui implique que2n/2 ≤ 2a. Donc n ≤ 2 log(2a)/ log 2, c’est-à-dire l’algorithme termine dans ≤ 2 log(2a)/ log 2étapes.

Remarque 1.12. Étant donné un nombre a, on peut l’écrire dans la base binaire, soita = 2k + dk−12

k−1 + · · ·+ d12 + d0, avec d0, d1, . . . , dk−1 ∈ 0, 1. On a que

2k ≤ a ≤ 2k + 2k−1 + · · ·+ 2 + 1 =2k+1 − 1

2− 1< 2k+1.

Donck ≤ log a

log 2< k + 1,

c’est-à-dire k = blog a/ log 2c. C’implique que k ≈ log a/ log 2 ou que log a ≈ 2 log 2. Alorsl’algorithme euclidien a besoin d’à peu près 2k étapes, qui est une fonction linéaire dansle nombre de chiffres binaires de a (qui est égal à k + 1). On dit qu’un tel algorithme estun algorithme linéaire. Si l’algorithme a besoin de kd étapes, pour un d ∈ N, on dit que

Page 13: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

1.2. LE PLUS GRAND COMMUN DIVISEUR 13

l’algorithme est polynomial (comme une fonction du nombre des chiffres binaires du donnéa). Finalement, si le nombre d’étapes dont l’algorithme a besoin pour terminer est unefonction qui augment plus rapidement que chaque polynôme (par exemple ek ou e

√k ou 2k

2),alors on dit que l’algorithme est exponentiel (toujours comme une fonction du nombre deschiffres binaires du donné a).

La puissance du théorème 1.9 est révélée dans les démonstration des résultats suivants,qui sont très utils.

Lemme 1.13. Soient d, a, b ∈ N. Alors d|a et d|b si et seulement si d|(a, b). C’est-à-dire,chaque commun diviseur de a et b divise leur plus grand commun diviseur.

Démonstration. Supposons que d|a et que d|b. On a que (a, b) = ax + by pour quelquesx, y ∈ Z. Donc d|ax+ by = (a, b), du lemme 1.2(b).

Réciproquement, supposons que d|(a, b). Par définition, on a que (a, b)|a et que (a, b)|b.Donc lemme 1.2(d) implique que d|a et que d|b.

Lemme 1.14. (ab, ac) = a · (b, c)

Démonstration. Soit d = (ab, ac) et e = (b, c). On veut montrer que d = ae. Il suffit demontrer que d|ae et que ae|d.

On a que e|b et que e|c. Donc ae|ab et ae|ac. Alors lemme 1.13 implique que ae|(ab, ac) = d.Réciproquement, on a que a|ab et que a|ac. Par la suite, a|(ab, ac) = d. On écrit d = ad′

et on observe que ad′|ab et que ad′|ac. Alors on trouve que d′|b et que d′|c, ce qui impliqueque d′|(b, c) = e. Donc d = ad′|ae, ce qui conclut la démonstration.

Proposition 1.15. Soit a, b ∈ Z. Si d = (a, b), alors il existe k, ` ∈ N tels que a = dk,b = d` et (k, `) = 1.

Démonstration. On sait que d|a et d|b, donc il existe k, ` tels que a = dk et b = d`. De plus,on a que

d = (a, b) = (dk, d`) = d · (k, `),

d’après le lemme 1.14. Donc (k, `) = 1, comme affirmé, ce qui conclut la démonstration.

Proposition 1.16 (Lemme d’Euclid). Soient a, b, c ∈ N avec (a, b) = 1. Si a|bc, alors a|c.

Démonstration. Puisque (a, b) = 1, alors il existe x, y ∈ Z tels que 1 = ax + by. Doncc = acx + bcy. On a que a|a et que a|bc. Par conséquent, on trouve que a divise leurcombinaison linéaire acx+ bcy = c. Ceci termine la démonstration.

Lemme 1.17. Soient a, b, c ∈ N avec (a, b) = 1. Si a|c et b|c, alors ab|c.

Démonstration. Soit c = ka. On a que b|c = ka et que (a, b) = 1. Donc le lemme d’Euclidnous donne que a|k. Alors, k = a` pour un ` ∈ N. C’implique que c = `ab, ce qui conclut ladémonstration.

Page 14: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

14 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

Proposition 1.18. Soient a, b, c ∈ N avec (a, b) = 1. Si (a, c) = (b, c) = 1, alors (ab, c) = 1.

Démonstration. Soit d = (ab, c). L’idée est que d ne peut pas avoir une partie communeni avec a ni avec b car d|c. En effet, soit d1 = (d, a). On a que d1|d|c et donc d1|c. Alorsd1|(a, c) = 1, ce qui implique que d1 = 1. Puisque (d, a) = 1 et d|ab, alors le lemme d’Euclidimplique que d|b. Mais dans ce cas on a que d|(b, c) = 1, d’où on déduit que d = 1, commeaffirmé.

On conclut cette section avec une généralisation du plus grand commun diviseur.

Définition 1.19. Soient a1, . . . , ak ∈ Z qui ne sont pas tous zéros. Le plus grand commundiviseur de a1, . . . , ak, dénoté par (a1, . . . , ak), est le plus grand nombre naturel qui divisechacun des nombres a1, a2, . . . , ak. C’est-à-dire

(a1, . . . , ak) = maxd ∈ N : d|aj (1 ≤ j ≤ k).

Exercices

Exercice 1.3. Calculez (a, b) et trouvez x et y tels que ax+ by = (a, b) quand

(a) a = 1287 et b = 4004,(b) a = 3185 et b = 1232,(c) a = 5021 et b = 1728.

Exercice 1.4. Soient 1 ≤ k ≤ n et d = (n, k). Montrez que nd|(nk

).

Exercice 1.5. Montrez que si (a, c) = 1, alors (ab, c) = (b, c).

Exercice 1.6. Soit a, b ∈ Z tels que (a, b) = 1. Montrez que

(a) (a+ b, a− b) = 1 ou 2.(b) (2a+ b, a+ 2b) = 1 ou 3.(c) (a+ b, a2 − 3ab+ b2) = 1 ou 5.

Classifiez quand chaque cas arrive.

Exercice 1.7. Montrez que ((a+ b)2, a2 + ab+ b2) = (a, b)2, pour tous a, b ∈ N.

Exercice 1.8. (a) Montrez que (a1, . . . , ak) = ((a1, . . . , ak−1), ak).(b) Montrez que d|aj pour chaque j ∈ 1, . . . , k si et seulement si d|(a1, . . . , ak).

1.3 Le plus petit commun multiple

On peut définir une notion qui est duale à la notion du plus grand commun diviseur :c’est le plus petit commun multiple de deux nombres.

Page 15: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

1.3. LE PLUS PETIT COMMUN MULTIPLE 15

Définition 1.20. Soient a, b ∈ Z \ 0. Le plus petit commun multiple de a et b, dénoté par[a, b], est défini d’être le plus petit nombre nombre naturel qui est divisible par a et par b.C’est-à-dire

[a, b] = minm ∈ N : a|m et b|m.

Remarque 1.21. Notre hypothèse que a, b 6= 0 implique que l’ensemble m ∈ N : a|m et b|mest non-vide, puisque |ab| y appartient toujours. Donc [a, b] est bien défini.

Le théorème suivant établit une relation simple entre le plus grand commun diviseur etle plus petit commun multiple de deux nombres.

Théorème 1.22. Si a, b ∈ N, alors [a, b](a, b) = ab.

Démonstration. Soit m = [a, b] et d = (a, b). Il existe k, ` ∈ N tels que a = dk, b = d` et(k, `) = 1. Avec cette notation, il suffit de montrer que m = [dk, d`] = dk`. Bien sur, dk`est un commun multiple de dk et de d`. Donc m ≤ dk`. De plus, on a que m = dkt et quem = dks, pour quelques t, s ∈ N. En particulier, dk|m, k|m/d et `|m/d. Puisque (k, `) = 1,le lemme 1.17 implique que k`|m/d. En particulier, k` ≤ m/d, ce qui conclut la preuve quem = dk`.

Lemme 1.23. Si a, b,m ∈ N, alors a|m et b|m si et seulement si [a, b]|m. C’est-à-dire,chaque commun multiple de a et de b est divisible par le plus petit commun multiple de a etde b.

Démonstration. Soit (a, b) = d, a = dk et b = d`, pour que (k, `) = 1. Théorème 1.3 impliesthat [a, b] = dk`. So it suffices to show that dk`|m. On a que a = dk|m. En particulier, d|met k|m/d. De même, on trouve que `|m/d. Puisque (k, `) = 1, alors k`|m/d, ce qui impliquedk`|m, comme affirmé. La direction réciproque est triviale.

Finalement, on remarque que, comme pour le plus grand commun diviseur, on peut définirle plus petit commun multiple de plusieurs nombres.

Définition 1.24. Soient a1, . . . , ak ∈ Z \ 0. Le plus petit commun multiple de a1, . . . , ak,dénoté par [a1, . . . , ak], est le plus petit nombre naturel qui est un multiple de chacun desnombres a1, a2, . . . , ak. C’est-à-dire

[a1, . . . , ak] = minm ∈ N : aj|m (1 ≤ j ≤ k).

Exercices

Exercice 1.9. Soient a1, . . . , ak ∈ Z \ 0.(a) Montrez que [a1, . . . , ak] = [[a1, . . . , ak−1], ak].(b) Montrez que aj|m pour chaque j ∈ 1, . . . , k si et seulement si [a1, . . . , ak]|m.(c) Si (ai, aj) = 1 pour tout i 6= j, montrez que [a1, . . . , ak] = a1 · · · ak.

Page 16: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

16 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

1.4 Nombres premiersÉtant donner un nombre, on peut souvent le factoriser. Par exemple, le nombre 420 est

évidemment divisible par 2, puisque 420 = 2 · 210. On ne peut pas factoriser plus le nombre2 mais on a que 210 = 2 · 105. Puis, on trouve que 105 = 5 · 21 et, finalement, que 21 = 3 · 7.Alors, on conclut que

420 = 2 · 2 · 3 · 5 · 7.On ne peut pas decomposer plus 420 car les nombres 2,3,5 et 7 n’ont pas de diviseurs non-triviaux (c’est-à-dire diviseurs différents de 1 et eux-mêmes). Il existe plus tels nombres. Parexemple, 13 et 23 ont aussi cette propriété. L’indecomposibilité de ces nombres les rends lesatoms de l’operation de multiplication. Pour cette raison, ils sont très importants et on lesdonne un nom spécial : ils sont les nombres premiers.

Définition 1.25. Un nombre n > 1 est appelé composé si il existe deux nombres a et b telsque 1 < a, b < n et n = ab.

Un nombre n > 1 est appelé premier si il n’est pas composé. De façon équivalente, unnombre n > 1 est premier si ses seuls diviseurs positifs sont 1 et n.

Comme l’exemple du nombre 420 pourrait laisser entendre, on peut écrire chaque nombren comme un produit de certains nombres premiers. De plus, ces facteurs premiers de n sontdéfinis de façon unique. C’est le context du théorème suivant, qui est un résultat d’importancefondamentale, comme son nom l’indique.

Théorème 1.26 (Théorème fondamental de l’arithmétique). Si n > 1, alors il existe desnombres premiers p1, . . . , pr tels que n = p1 · · · pr. De plus, les nombres p1, . . . , pr sont définisde façon unique, dans le sens que si n = q1 · · · qs pour quelques nombres premiers q1, . . . , qs,alors s = r et les nombres q1, . . . , qs sont une permutation des nombres p1, . . . , pr.

Avant de montrer le théorème fondamental de l’arithmétique, on a besoin d’un résultatpréparatoire.

Lemme 1.27. Soit p un nombre premier.(a) Si a ∈ Z, alors soit p|a soit (a, p) = 1.(b) Si p|a1 · · · ak pour quelques entiers a1, . . . , ak, alors p|ai pour un i ∈ 1, . . . , k.

Démonstration. (a) Soit d = (a, p). On a que d|p. Donc soit d = 1 soit d = p. Dans ledeuxième cas, on déduit que d = p|a.

(b) Par induction sur k. Si k = 1, le résultat est trivial. Puis, supposons qu’il est vraipour k − 1. Si p|a1 · · · ak, alors soit p|ak soit p - ak. Au premier cas, le résultat découle. Audeuxième cas, on a que (ak, p) = 1 selon la partie (a). Donc le lemme d’Euclid impliqueque p|a1 · · · ak−1 et l’hypothèse inductive nous dit que p|ai pour un i ∈ 1, . . . , k − 1. Cecitermine l’étape inductive et, par la suite, la démonstration.

Démonstration du théorème fondamental de l’arithmétique. Tout d’abord, on montre l’exis-tence de la factorisation de tous les nombres en nombres premiers. On le ferra de façon induc-tive. Le théorème est vrai pour n = 2, puisque 2 est premier et, par conséquent, il le produit

Page 17: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

1.4. NOMBRES PREMIERS 17

de nombres premiers. Puis, on considère un nombre n ≥ 3 et on suppose que le théorème estvrai pour tout les nombres m ∈ 2, . . . , n − 1. Si n est premier, alors il est déjà factorisécomme le produit de nombres premiers et le théorème est vrai pour n aussi. Finalement, sin est composé, alors il existe a, b ∈ N tels que n = ab et 1 < a, b < n. Alors l’hypothèseinductive implique que on peut écrire a et b comme le produit de nombres premiers, soienta = p1 · · · pr et b = pr+1 · · · pr+s. Evidemment, c’implique que n = ab = p1p2 · · · pr+s, ce quiconclut l’étape inductive et, par la suite, la première partie de la démonstration.

Finalement, on montre l’unicité de la factorisation de n en nombres premiers. Soient deuxfactorisations de n, n = p1 · · · pr = q1 · · · qs. Bien sur, on a que q1|p1 . . . pr. Donc, le lemme1.27(b) implique que q1|pi1 pour un i1 ∈ 1, . . . , r. Par la suite, (pi1 , q1) > 1 et le lemme1.27(a) nous donne que pi|q1 aussi. Alors, on trouve que q1 = pi1 . Puisque q1 · · · qs = p1 · · · pr,alors q2 · · · qs =

∏i 6=i1 pi. On répète le même argument avec q2 : on a que q2|

∏i 6=i1 pi et donc

il existe i2 ∈ 1, . . . , r \ i1 tel que q2 = pi2 . On continue de cette façon et, inductivement,on trouve que il existe s indices i1, . . . , is distincts appartenants à 1, . . . , r tels que qj = pij ,pour tout j ∈ 1, . . . , s. Donc la relation q1 · · · qs = p1 · · · pr devient

1 =∏

1≤i≤ri/∈i1,...,is

pi.

Ceci montre que r = s aussi et le théorème découle.

Corollaire 1.28. Si n > 1, alors il existe nombres premiers p1 < · · · < pr et exposantsv1, . . . , vr ∈ N uniques tels quen = pv11 · · · pvrr .

Démonstration. C’est un corollaire directe du théorème fondamental de l’arithmétique : soitn = q1 · · · qs la factorisation de n en nombres premiers. Même si les indices de q1, q2, . . . , qssont différents, ils peuvent être le même nombre premier parfois. Soient p1, . . . , pr les facteurspremiers distincts de n. Chaque tel facteur appairait avec une certaine multiplicité dans lafactorisation n = q1 · · · qs. Si vi est la multiplicité d’occurrence de pi, alors on trouve que

n = q1 · · · qs = pv11 · · · pvrr .

Sans perde de généralité, on peut supposer que les nombres p1, . . . , pr sont en order croissantde magnitude ; sinon, on les permute pour garantir ceci. Finalement, l’unicité des nombresp1, . . . , pr et v1, . . . , vr est une conséquence directe de l’unicité de q1, . . . , qs (à part d’unepermutation possible).

La factorisation n = pv11 · · · pvrr avec p1 < · · · < pr est appelée la factorisation première den. Son existence et unicité nous permet de définir

vp(n) := maxv ≥ 1 : pv|n

pour chaque nombre premier p et chaque n ∈ N. On appel vp(n) la valuation de n au nombrepremier p. Bien sur, si n est fixé, alors vp(n) = 0 pour presque tous les nombres premiers, c’est-à-dire la relation vp(n) = 0 est vraie pour tous les nombres premiers dehors un ensemble fini(qui pourrait dépendre de n). Donc on peut considérer le produit

∏p p

vp(n) sans problèmes.En fait, le corollaire 1.28 implique tout de suite que n =

∏p p

vp(n).

Page 18: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

18 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

Souvent, étant donné un nombre premier p, on utilisera la notation pv‖n, qui veut direque la plus grande puissance de p qui divise n est égale à v, c’est-à-dire pv|n et pv+1 - n. Biensur, on a que pv‖n si et seulement si v = vp(n).

En utilisant la notion de la valuation, on peut écrire le plus grand commun diviseur et leplus petit commun multiple de deux nombres en termes de leurs factorisations premières.

Proposition 1.29. Soient a, b ∈ N.(a) On a que a|b si et seulement si vp(a) ≤ vp(b), pour tout nombre premier p.(b) (a, b) =

∏p p

minvp(a),vp(b).

(c) [a, b] =∏

p pmaxvp(a),vp(b).

Démonstration. (a) Supposons que a|b et soit p un nombre premier. Puisque pvp(a)|a, alorspvp(a)|b, ce qui implique que vp(a) ≤ vp(b).

Réciproquement, supposons que vp(a) ≤ vp(b) pour tout nombre premier p. Donc on peutconsidérer le nombre entier k =

∏p p

vp(b)−vp(a). Evidemment, on a que b = ka, cequi impliqueque a|b.

(b) On a que d|a et d|b si et seulement si vp(d) ≤ vp(a) et vp(d) ≤ vp(b) pour tout p, siet seulement si vp(d) ≤ minvp(a), vp(b) pour tout p, si et seulement si d|

∏p p

minvp(a),vp(b).Ceci conclut la démonstration de la partie (b).

(c) On a que a|m et b|m si et seulement si vp(a) ≤ vp(m) et vp(b) ≤ vp(m) pour tout p, si etseulement si maxvp(a), vp(b) ≤ vp(m) pour tout p, si et seulement si

∏p p

maxvp(a),vp(b)|m.Ceci conclut la démonstration de la partie (c).

L’infinité des nombres premiers. Les nombres premiers sont si fondamentaux que laquestion de leur repartition entre les nombres entiers est inévitable. Euclide a montré qu’il ya un nombre infini de premiers. On étudiera leur repartition de façon precise au chapitre 7.

Théorème 1.30 (Euclide). Il existe une infinité de nombres premiers.

Démonstration. Supposons, au contraire, que l’ensemble des nombres premiers est fini, soitp1, · · · , pk. On considère le nombre n = 1 + p1 · · · pk. Ce nombre est plus grand que tousles pi et, par la suite, il est composé. Donc il existe un nombre premier p qui divise n.Nécessairement, p = pi0 pour un certain indice i0 ∈ 1, . . . , k. Mais c’est impossible carles relations pi0|n et pi0 |p1 · · · pk impliquent que p|(n − p1 · · · pk) = 1. On est arrivé à unecontradiction. Alors l’hypothèse que l’ensemble des nombres premiers est fini ne peut pasêtre vrai, ce qui est ce qu’il fallait démontrer.

Le crible d’Eratosthenes. Étant donné le caractère fondamental des nombres premiers,c’est important d’être capable de les calculer. Une méthode pour le faire est appelé le cribled’Eratosthenes. Elle se base au résultat suivant.

Théorème 1.31. Si n > 1 est composé, alors il existe un nombre premier p ≤√n qui divise

n.

Page 19: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

1.4. NOMBRES PREMIERS 19

Démonstration. Si n est composé, alors n = ab pour quelques nombres a, b ∈ 2, . . . , n− 1.Sans perde de généralité, on peut supposer que a ≤ b. En particulier, a2 ≤ ab = n, cequi implique que a ≤

√n. Alors, si p est un facteur premier de a, qui existe du théorème

fondamental de l’arithmétique, on trouve que p|n et p ≤ a ≤√n. Ceci conclut la démons-

tration.

À partir de ce théorème, on peut construire un algorithme qui déterminera tous lesnombres premiers dans l’intervalle [1, x], pour un x donné. L’algorithme a les étapes sui-vantes :

Étape 1 : Énumérer tous les entiers dans (1, x].Étape 2 : Trouver le plus petit entier n ∈ (1,

√x] qui n’est pas déjà ni encerclé ni

supprimé et encercler-le. Si un tel n n’existe pas, terminer l’algorithme.Étape 3 : Supprimer tous les multiples de n qui sont plus grands que n.Étape 4 : Retourner à la deuxième étape.

Les nombres que ne sont pas supprimés quand cet algorithme termine sont exactementles nombres premiers contenants à [1, x]. On ferra un exemple concret pour expliquer lemécanisme de l’algorithme d’Eratosthenes mieux. Supposons qu’on veut trouver tous lesnombres premiers jusqu’a x = 40. On a que

√40 ≈ 6.32, donc on doit répéter le troisième

étape de l’algorithme au plus 5 fois (en fait, comme on verra, il suffit de le faire 3 fois). Oncommence par énumérer tous les nombres jusqu’à 40.

2 3 4 5 6 7 89 10 11 12 13 14 15 1617 18 19 20 21 22 23 2425 26 27 28 29 30 31 3233 34 35 36 37 38 39 40

Le plus petit nombre de notre liste est 2. On l’encercle et on supprime tous ses plusgrands multiples :

1 2 3 4 5 6 7 89 10 11 12 13 14 15 1617 18 19 20 21 22 23 2425 26 27 28 29 30 31 3233 34 35 36 37 38 39 40

Le plus petite nombre qui n’est pas encerclé ni supprimé est 3. On l’encercle et onsupprime tous ses plus grands multiples (on a besoin de supprimer seulement les nombresqui n’étaient pas déjà éliminés à la dernière étape ; par exemple, 6 était déjà enlevé commeun multiple de 2) :

1 2 3 4 5 6 7 89 10 11 12 13 14 15 1617 18 19 20 21 22 23 2425 26 27 28 29 30 31 3233 34 35 36 37 38 39 40

Page 20: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

20 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

Le seul nombre au-dessous√

40 ≈ 6.32 qui reste et qu’il n’est pas ni encerclé ni suppriméest le nombre 5. On l’encercle et on supprime tous ses plus grands multiples :

1 2 3 4 5 6 7 89 10 11 12 13 14 15 1617 18 19 20 21 22 23 2425 26 27 28 29 30 31 3233 34 35 36 37 38 39 40

Il ne reste plus de nombres dans [1,√

40] qui ne s’étaient pas traités, donc l’algorithmetermine ici. On conclut que les nombres premiers entre 1 et 40 sont les nombres 2, 3, 5, 7,11, 13, 17, 19, 23, 29, 31 et 37.

Exercices

Exercice 1.10. (a) Montrez que (a, b) > 1 si et seulement si il existe un nombre premierp tel que p|a et p|b.

(b) Montrez que (xm, xn + 1) = 1, pour chaque m,n ∈ N.(c) Si a ≡ 3 (mod 7), alors montrez que (a3 − a, a3 − a + 7) = 1. Quand est-ce que (a3 −

a, a3 − a+ 7) > 1 ?(d) Montrez que (ab, a+ b2, a+ b+ 1) = 1 pour chaque a, b ∈ N.

Exercice 1.11. (a) Soit k ≥ 2 et n ∈ N dont la première factorisation est n = pv11 · · · pvrr .Montrez que n est une k-ième puissance parfaite si est seulement si k|vi, pour touti ∈ 1, . . . , r.

(b) Est-ce qu’il existe un nombre naturel n tel que sa moitié est un carré parfait, son tiersest un cube est son cinquième est une cinquième puissance ?

Exercice 1.12. Soient k ≥ 2 et a, b ∈ N. Montrez que ak|bk si et seulement si a|b.

Exercice 1.13. Montrez que, pour chaque entier n ≥ 1, le nombre 4n3 + 6n2 + 4n + 1 estcomposé. [Indice : Développez (x+ y)4.]

Exercice 1.14. Un nombre n est appelé sans carré facteur si il n’existe pas de a > 1 dont lecarré divise n. Un nombre n est appelé plein de carrés si p2|n pour tout les nombres premiersp qui divisent n.

(a) Montrez que n est sans carré si et seulement si n = p1 · · · pr pour quelques nombrespremiers distincts p1, . . . , pr.

(b) Montrez que n est plein de carrés si et seulement si n = pv11 · · · pvrr pour quelquesnombres premiers distincts p1, . . . , pr et quelques exposants v1, . . . , vr ≥ 2.

(c) Montrez que chaque nombre entier peut s’écrire comme n = ab, où a est sans carréfacteur, b est plein de carrés et (a, b) = 1.

(d) Montrez que chaque nombre entier peut s’écrire comme n = ab2, où a est sans carréfacteur.

Page 21: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

1.5. FONCTIONS MULTIPLICATIVES 21

(e) Montrez qu’un nombre plein de carrés n peut s’écrire comme n = a2b3, pour quelquesentiers a et b.

Exercice 1.15. Si n = pv11 · · · pvrr est la première factorisation de n, alors on pose

ω(n) = r et Ω(n) = v1 + · · ·+ vr,

avec la convention que ω(1) = Ω(1) = 0.(a) Montrez que vp(mn) = vp(m) + vp(n) et que Ω(mn) = Ω(m) + Ω(n).(b) Montrez que si (m,n) = 1, alors ω(mn) = ω(m) + ω(n).

Exercice 1.16 (Furstenberg). On muni l’ensemble des nombres entiers d’une topologie,comme suivant :

— ∅ et Z sont ouverts,— chaque progression arithmétique S(a, b) := an+ n : n ∈ Z est ouvert,— les unions des ensembles ouverts sont également ouverts.

Montrez que :(a) Les progressions arithmétiques sont également fermés.(b) Chaque ensemble fini n’est pas ouvert.(c) Z \ −1, 1 n’est pas fermé.(d) Z \ −1, 1 =

⋃p premier S(p, 0).

Concluez que il existe une infinité de nombres premiers.

1.5 Fonctions multiplicativesUne classe importante de fonctions dans la théorie des nombres sont les fonctions multi-

plicatives. Elles sont des fonctions qui respectent la structure multiplicative des entiers. Ladéfinition précise suit.

Définition 1.32. Une fonction f : N → C est appelée multiplicative si f 6= 0 (c’est-à-dire,s’il existe n ∈ N tel que f(n) 6= 0) et si

f(mn) = f(m)f(n) quand (m,n) = 1.(1.1)

Si la relation (1.1) tient pour tous m,n ∈ N, on dit que f est complètement multiplicative.

Par exemple, les fonctions n→ nα, où α ∈ C, sont toutes complètement multiplicatives.Le théorème suivant nous fournit d’autres exemples de fonctions multiplicatives.

Théorème 1.33. Si α ∈ C, la fonction σα, définie par

σα(n) =∑d|n

dα,

est multiplicative.

Page 22: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

22 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

Démonstration. Supposons que (m,n) = 1. Alors, chaque diviseur d de mn peut s’écrire defaçon unique comme d = d1d2, où d1|m et d2|n. En effet, cette décomposition est donnée parles nombres d1 =

∏pv‖d, p|m p

v et d2 =∏

pv‖d, p|n pv. Par la suite,

σα(mn) =∑d|mn

dα =∑d1|md2|n

dα1dα2 =

∑d1|m

dα1

∑d2|n

dα2

= σα(m)σα(n),

comme affirmé.

Remarque 1.34. Les cas avec α = 0 et α = 1 du théorème 1.33 sont d’importance spéciale.Le cas α = 0 correspond à la fonction diviseur

τ(n) := #d|n

et le cas α = 1 correspond à la fonction “sommes de diviseurs”

σ(n) :=∑d|n

d.

Si on sait qu’une fonction est multiplicative, on peut la calculer à condition qu’onconnaisse ses valuers aux puissances de nombres premiers :

Proposition 1.35. Soit f une fonction multiplicative.(a) On a que f(1) = 1.(b) Si n = pv11 p

v22 · · · pvrr est la factorisation de n à ses facteurs premiers distincts, alors

f(n) = f(pv11 )f(pv22 ) · · · f(pvrr ).

Si, de plus, f est complètement multiplicative, alors

f(n) = f(p1)v1f(p2)

v2 · · · f(pr)vr .

Démonstration. (a) Par définition, il existe n ∈ N tel que f(n) 6= 0. Mais on a que f(n) =f(n · 1) = f(n)f(1) car (n, 1) = 1 et, par la suite, f(1) = 1.

(b) On utilise induction sur r. Si r = 1, il n’y a rien à montrer. Supposons maintenant quela proposition est vraie quand n a r−1 facteurs premiers distincts. Puisque (pv11 , p

v22 · · · pvrr ) =

1, on trouve que

f(n) = f(pv11 )f(pv22 · · · pvrr ) = f(pv11 )f(pv22 ) · · · f(pvrr ),

selon l’hypothèse inductive. Ceci termine la démonstration de la première partie. Finalement,si f est complètement multiplicative, alors

f(pv) = f(p · pv−1) = f(p)f(pv−1) = · · · = f(p) · · · f(p)︸ ︷︷ ︸v fois

= f(p)v,

ce qui conclut la démonstration.

Page 23: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

1.5. FONCTIONS MULTIPLICATIVES 23

Corollaire 1.36. Soit n = pv11 pv22 · · · pvrr la factorisation première du nombre n. Alors

τ(n) = (v1 + 1)(v2 + 1) · · · (vr + 1)

et

σ(n) =r∏j=1

pvj+1j − 1

pj − 1.

Démonstration. Exercice.

On conclut cette section avec une application classique du théorème 1.33 qui caractériseles nombres parfaits :

Définition 1.37. Un nombre n est appelé parfait si il est la somme de ses propres diviseurs,c’est-à-dire si

n =∑

d|n, d<n

d.

De façon équivalent, n est parfait si et seulement si σ(n) = 2n.

Par exemple, 6 est parfait : on a que 6 = 1 + 2 + 3. D’autres exemples sont les nombres28 et 496. Les nombres parfaits ont fasciné Euclid et plusieurs autres personnes pendantles années. En fait, Euclid a trouvé une façon générale d’engendrer de nombres parfaits.Cependant, il ne pouvait pas trouver de nombres parfait impairs, ni les autres personnesqu’ont essayés. Aujourd’hui, c’est une conjecture ouverte fameuse de prouver qu’il n’existepas de nombres parfaits impairs. D’autre coté, les nombres parfaits pairs sont complètementclassifiés, grâce à Euclid et Euler :

Théorème 1.38 (Euclid, Euler). Un nombre pair n est parfait si et seulement si il existeun nombre premier p tel que 2p − 1 est également premier et que n = 2p−1(2p − 1).

Démonstration. Tout d’abord, si n = 2p−1(2p − 1), où p est un nombre premier pour lequel2p − 1 est aussi premier, alors on a que

σ(n) = σ(2p−1(2p − 1)) = σ(2p−1)σ(2p − 1) =2p − 1

2− 1· 2p = 2n,

comme souhaité.Réciproquement, supposons que n est un nombre parfait impair. On écrit n = 2vm, où

v ≥ 1 et m est impair. On a que σ(n) = σ(2v)σ(m) = (2v − 1)σ(m). D’autre coté, on a queσ(n) = 2n = 2v+1m, c’est-à-dire (2v+1 − 1)σ(m) = 2v+1m. Puisque (2v+1, 2v+1 − 1) = 1 et2v+1 − 1 divise 2v+1m, alors m = (2v+1 − 1)` pour un ` ∈ N. Donc on trouve que

2v+1(2v+1 − 1)` = (2v+1 − 1)σ(m) =⇒ 2v+1` = σ(m).

On affirme que ` = 1. Sinon, on aurait que 1, ` et m sont tous diviseurs distincts de m =(2v+1 − 1)` et, par la suite,

σ(m) ≥ 1 +m+ ` = 2v+1`+ 1 > 2v+1`,

Page 24: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

24 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS

ce qui est impossible. Donc ` = 1, comme affirmé, ce qui implique que σ(2v+1 − 1) = 2v+1.De cette dernière relation, on déduit tout de suite que 2v+1− 1 est premier ; sinon, il existaitd ∈ (1, 2v+1 − 1) qui divisait 2v+1 − 1 et, conséquemment,

σ(2v+1 − 1) ≥ 1 + d+ (2v+1 − 1) > 2v+1,

ce qui est une contradiction. Donc 2v+1−1 est en effet premier. Il reste de montrer que v+ 1est premier. Sinon, on aurait que v+ 1 = ab pour quelques a, b ∈ N avec a, b > 1. Mais dansce cas on aurait que

2v+1 − 1 = (2a)b − 1 = (2a − 1)((2a)b−1 + (2a)b−2 + · · ·+ 2a + 1),

ce qui contredit le fait que 2v+1 − 1 est premier. Alors v + 1 est premier et le résultat désirédécoule.

Exercices

Exercice 1.17. (a) Montrez que si f est une fonction arithmétique telle que f(n) =∏pv‖n f(pv) pour chaque n ∈ N, alors f est multiplicative. De plus, montrez que si

f(n) =∏

pv‖n f(p)v, alors f est fortement multiplicative.(b) Montrez que si f est une fonction arithmétique telle que f(n) =

∏p|n f(p) pour chaque

n ∈ N, alorsf(mn)f((m,n)) = f(m)f(n) (m,n ∈ N).

Déduisez que f est multiplicative.

Exercice 1.18. Est-ce que la fonction f(n) = (−1)n−1 multiplicative ou pas ?

Exercice 1.19. Prouvez le corollaire 1.36.

Exercice 1.20. Trouvez les trois premiers nombres parfaits.

Exercice 1.21. Montrez que n est un nombre parfait si et seulement si∑

d|n 1/d = 2.

Exercice 1.22. Soitf(n) = #(n1, n2) ∈ N2 : [n1, n2] = n.

Montrez que f est multiplicative and évaluez-la aux puissances des nombres premiers.

Page 25: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 2

Arithmétique modulaire

L’arithmétique modulaire est une façon d’étudier des fonctions périodiques, ainsi que ladivisibilité d’un entier par un autre. Un exemple d’une fonction périodique est le temps : lesheures se répètent chaque jour, les jours se répètent chaque semaine, et les mois se répètentchaque an. Un autre exemple plus musical est l’octave : elle octave se compose de douzesemitones et se répète périodiquement quand on change la fréquence du son continûment.Cependant, ici on s’intéresse principalement aux phénomènes arithmétiques. Un tel exempleest la propriété d’être divisible par 5. C’est une propriété 5-périodique (c’est-à-dire, de période5) : soit tous les membres de la progression arithmétiquen a+ 5k : k ∈ Z sont de multiplesde 5, ou aucun membre ne l’est. Un autre exemple, plus élaboré, est la propriété que 7 divisele nombre x2 + 1. Comme on le verra, la période ici est 7.

2.1 CongruencesDéfinition 2.1. Soit n ∈ N. On dit que deux nombres a, b ∈ Z sont congruents modulo n sin|(a− b). Dans ce cas, on écrit a ≡ b (modn).

À partir de cette définition, on voit tout-de-suite que tous les nombres dans la progressionarithmétique a + kn : k ∈ Z sont congruents à a. En fait, c’est facile de vérifier que lacongruence modulo n est une relation d’équivalence dont les classes d’équivalences sontexactement les différentes progressions arithmétiques d’étape n.

Définition 2.2. Une classe d’équivalence modulo n est appelée une classe de congruencemodulo n ou un résidu modulo n. L’ensemble de tous les résidus modulo n est dénoté parZ/nZ. Finalement, un système complet de représentants des classes d’équivalence modulo nest appelé un système complet de résidus modulo n.

Remarque 2.3. On utilisera la notation a (modn) pour dénoter la classe d’équivalence dea modulo n.

Lemme 2.4. Pour tout n ∈ N, l’ensemble 0, 1, . . . , n − 1 est un système complète derésidus modulo n, c’est-à-dire

Z/nZ = 0 (modn), 1 (modn), . . . , n− 1 (modn).

25

Page 26: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

26 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

En particulier, |Z/nZ| = n.

Démonstration. La division euclidienne nous dit que pour chaque a ∈ Z il existe q ∈ Z etr ∈ 0, 1, . . . , n − 1 tels que a = qn + r. En particulier, a ≡ r (modn). Il reste de prouverque si 0 ≤ i < j ≤ n− 1, alors i 6≡ j (modn). En effet, on a que 0 < j − i < n et il n’y a pasde multiples de n dans l’intervalle (0, n). Donc i 6≡ j (modn), comme affirmé.

À partir du système complet de résidus 0, 1, . . . , n − 1, on peut construire d’autressystèmes complets :

Lemme 2.5. Soient n ∈ N et a, b ∈ Z. Si (a, n) = 1, alors l’ensemble

aj + b : 0 ≤ j ≤ n− 1

est un système complet de résidus.

Démonstration. Il suffit de montrer que si aj + b ≡ aj′ + b (modn) et 0 ≤ j, j′ ≤ n − 1,alors j = j′. En effet, on a que n|(aj + b)− (aj′ + b) = a(j − j′). Puisque (a, n) = 1, alors lelemme d’Euclid implique que n|(j − j′). Mais |j − j′| ≤ n − 1 et le seul multiple de n dansl’intervalle [−(n− 1), n− 1] est 0. Donc j = j′, comme affirmé.

On déduit tout-de-suite le résultat suivant qui est très utile.

Corollaire 2.6. Soit n ∈ N. Un ensemble de n nombres entiers consécutifs est un systèmecomplet de résidus modulo n. En particulier, l’ensemble Z ∩ (−n/2, n/2] est un systèmecomplet de résidus modulo n.

Démonstration. La première partie découle du lemme 2.5, puisque un ensemble de n nombresentiers consécutifs peut s’écrire dans la forme j + b : 0 ≤ j ≤ n − 1 pour un b ∈ Z. Pourla deuxième partie, on observe que Z ∩ (−n/2, n/2] est toujours un ensemble de n nombresentiers consécutifs. (Vérifiez-le comme exercice.)

Le concept des congruences révèle sa puissance quand on considère son comportementsous les operations de l’addition et de la multiplication.

Lemme 2.7. Soient n ∈ N et a, b, c, d ∈ Z. Si a ≡ b (modn) et c ≡ d (modn), alorsa+ c ≡ b+ d (modn) et ac ≡ bd (modn).

Démonstration. (a) On a que n|(a−b) et que n|(c−d). Donc n|(a−b)+(c−d) = (a+c−b−d),ce qui implique que a + c ≡ b + d (mod d), et que n|c(a − b) − b(c − d) = ac − bd, d’où ondéduit que ac ≡ bd (modn).

(b) On a que n|(ab− ac) = a(b− c). Puisque (a, n) = 1, le lemme d’Euclid implique quea|b− c, c’est-à-dire b ≡ c (modn).

Donc on voit que les congruences respectent les operations algébriques de base. En par-ticulier, on peut définir la somme et le produit de deux résidus a (modn) et b (modn) par

a (modn) + b (modn) := a+ b (modn) et a (modn) · b (modn) := ab (modn).

Page 27: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.1. CONGRUENCES 27

Ces opérations sont bien définies d’après le lemme 2.7. Il existe une difference fondamentaleentre l’arithmétique de Z et l’arithmétique de Z/nZ. On sait que les seuls nombres entiersqui possèdent un inverse qui est également entier sont −1 et 1. L’inverse des autres entiersn’appartient pas à Zmais àQ. Ce n’est pas le cas pour Z/nZ, où plusieurs éléments possèdentd’inverses.

Lemme 2.8. Soient n ∈ N et a, x, y ∈ Z.(a) On a que ax ≡ ay (modn) si et seulement si x ≡ y (modn/(a, n)). En particulier, si

(a, n) = 1, alors on a que ax ≡ ay (modn) si et seulement si x ≡ y (modn).(b) Si (a, n) = 1, alors il existe un résidu unique b (modn) tel que ab ≡ 1 (modn).

Démonstration. (a) On pose d = (a, n) et on écrit n = dn1 et a = da1 pour que (n1, a1) = 1.Si ax ≡ ay (modn), alors n|(ax − ay) = a(x − y), ce qui implique que n1|a1(x − y).

Puisque (a1, n1) = 1, le lemme d’Euclid implique que n1|(x− y), c’est-à-dire x ≡ y (modn1),comme affirmé.

Réciproquement, si x ≡ y (modn1), alors n1|(x − y) et, par la suite, dn1|d(x − y). Enparticulier, n = dn1|da1(x− y) = a(x− y), ce qui implique que ax ≡ ay (modn).

(b) Puisque (a, n) = 1, le lemme 1.9 implique l’existence de b, c ∈ Z tels que ab+nc = 1.Donc ab ≡ 1 (modn). Finalement, on montre que b est défini uniquement modulo n. En effet,si ab′ ≡ 1 (modn) pour un autre b′ ∈ Z, alors ab ≡ ab′ (modn) et la partie (a) du lemmeimplique que b ≡ b′ (modn).

Si (a, n) = 1, alors on dénote la classe d’équivalence de b (modn) pour laquelle ab ≡1 (modn) par a (modn) ou, si ceci ne cause pas de confusion, par a. On appelle a l’inversede a modulo n. Parfois on écrira aussi 1/a (modn) ou a−1 (modn). Le fait que les résidusqui sont copremiers à n possèdent un inverse mod n les offrent un rôle spécial. Donc on lesappellent résidus réduits. L’ensemble de tous les résidus est dénoté par (Z/nZ)∗, c’est-à-dire

(Z/nZ)∗ := a (modn) : (a, n) = 1.

Sa cardinalité est appelée la fonction d’Euler et elle dénotée par

φ(n) := #(Z/nZ)∗.

Remarque 2.9. La démonstration du lemme 2.8 donne une façon de calculer d’inverse d’unrésidu quadratique. Par exemple, si a = 100 et n = 271, alors on applique l’algorithmed’Euclid afin de trouver que

271 = 2 · 100 + 71, 100 = 71 + 29, 71 = 2 · 29 + 13, 29 = 2 · 13 + 3, 13 = 4 · 3 + 1,

donc

1 = 13− 4 · 3= 13− 4 · (29− 2 · 13) = 9 · 13− 4 · 29

= 9 · (71− 2 · 29)− 4 · 29 = 9 · 71− 22 · 29

= 9 · 71− 22 · (100− 71) = 31 · 71− 22 · 100

= 31 · (271− 2 · 100)− 22 · 100

= 31 · 271− 84 · 100.

Page 28: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

28 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

Alors, on conclut que 100 ≡ −84 (mod 271).

L’inversibilité des résidus quadratiques veut dire qu’on peut diviser par eux. En effet,si a ∈ Z/nZ et b ∈ (Z/nZ)∗, alors ab (modn) joue le rôle de la fraction a/b. Dans le casspécial où n = p est premier, alors tous les résidus modulo p, sauf 0 (mod p) sont copremiersà p. Donc on peut diviser par tous les résidus non-zéros et on prend un nouveau résidumodulo p, exactement comme on peut diviser un nombre réel par un autre nombre réel quiest non-zéro, et le résultat de cette division est un nouveau nombre réel. C’est une propriététrès importante des nombres premiers qu’on exploitera plusieurs fois dans ce chapitre et lessuivants. Pour l’instance, on établit un lemme qui montre que certains équations sur Z/pZse comportent de la même façon que sur R.

Lemme 2.10. Soit p un nombre premier. On a que a2 ≡ b2 (mod p) si et seulement sia ≡ b (mod p) ou a ≡ −b (mod p).

Démonstration. Supposons que p|(a2− b2) = (a− b)(a+ b). Puisque p est premier, le lemma1.27(b) implique que soit p|(a − b) soit p|(a + b), c’est-à-dire soit a ≡ b (mod p) soit a ≡−b (mod p). Réciproquement, on a que (−b)2 ≡ a2 (mod p). Donc si a ≡ ±b (modn), alors lelemme 2.7 implique que a2 ≡ b2 (mod p).

On termine cette section avec une discussion d’équations polynomiales modulo un nombrepremier n. On commence avec le lemme suivant.

Lemme 2.11. Soit f(x) ∈ Z[x]. Si a ≡ b (modn), alors f(a) ≡ f(b) (modn).

Démonstration. Soit f(x) = cdxd + · · ·+ c1x+ c0. En utilisant le lemme 2.7(a) et induction

sur j, on peut montrer que la relation a ≡ b (modn) implique que aj ≡ bj (modn), pour toutj ∈ N. Donc on a que cjaj ≡ cjb

j (modn) pour tout j ∈ 0, 1, . . . , d. En appliquant encoreune fois le lemme 2.7(a) (de façon inductive), on trouve que

f(a) = cdad + · · ·+ c1a+ c0 ≡ cdb

d + · · ·+ c1b+ c0 (modn) ≡ f(b) (modn),

ce qui est ce qu’il fallait démontrer.

Le lemme precedent nous permet de parler de solutions d’une équation polynomialemodulo n, ou de racines d’un polynôme f(x) ∈ Z[x] modulo un nombre naturel n. En effet,du lemme 2.11, l’ensemble x (modn) : f(x) ≡ 0 (modn) est bien défini. De plus, si onchoisi un système complet de résidus modulo n, par exemple 0, 1, . . . , n− 1, on peut écrirecet ensemble comme 0 ≤ x ≤ n− 1 : f(x) ≡ 0 (modn).

2.2 Critères de divisibilité

On apprend à l’école quelques critères simples pour déterminer si un nombre est divisiblepar 5, 10, 3 ou 9. Ici on explique l’origin de ces critères et on voit une façon générale d’obtenirde critères de divisibilité par n’importe quel nombre. On commence avec l’explication descritères familiers.

Page 29: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.2. CRITÈRES DE DIVISIBILITÉ 29

Soit n = (akak−1 · · · a1a0)10, où a0, a1, . . . , ak ∈ 0, 1, . . . , 9, l’expansion décimale dunombre n, c’est-à-dire

n = a0 + a110 + · · ·+ ak−110k−1 + ak10k.

Soit aussi un nombre d, qu’on prendra d’être 3,5,9 ou 10. La réalisation-clé est que d|n siet seulement si n ≡ 0 (mod d). Donc si on sait la classe d’équivalence des puissances de 10modulo d, alors on peut réécrire n (mod d) dans une façon qui, avec un peu de chance, seraplus simple.

Par exemple, on a que 10i ≡ 0 (mod 10), pour tout i ∈ 1, . . . , k, et donc

n ≡ a0 + a1 · 0 + · · ·+ ak · 0 (mod 10) ≡ a0 (mod 10).

Par la suite, 10|n si et seulement si 10|a0. Mais a0 appartient à 0, 1, . . . , 9 et le seul multiplede 10 dans cet ensemble et le nombre 0. Donc 10|n si et seulement si a0 = 0. C’est le critèrefamilier de divisibilité par 10.

De même, puisque 10i ≡ 0 (mod 10), on a que n ≡ a0 (mod 5). Donc 5|n si et seulementsi 5|a0. Puisque a0 ∈ 0, 1, . . . , 9, on trouve que 5|a0 si et seulement si a0 ∈ 0, 5.

Les critères de visibilité par 3 et par 9 sont plus compliqués mais leurs démonstrationssont aussi faciles. On a que 3|n si et seulement si 3 divise a0 + a1 + · · · + ak, la somme deschiffres décimales de n. Le critère demeure pareil pour 9 : on a que 9|n si et seulement si 9divise a0 +a1 + · · ·+ak. On montrera le critère pour 3 ; la lectrice peut vérifier facilement quele même argument marche pour 9 également. Comme avant, la première étape est de calculerla classe d’équivalence des puissances de 10 modulo 3. Bien sur on a que 10 ≡ 1 (mod 3).Donc 10j ≡ 1j (mod 3) ≡ 1 (mod 3). Donc

n ≡ a0 + a1 · 1 + · · ·+ ak · 1 (mod 3) ≡ a0 + a1 · · ·+ ak (mod 3).

Alors, on conclut que 3|n si et seulement si 3 divise a0 + a1 · · ·+ ak.

Les critères de divisibilité modulo 3,5,9 et 10 sont particulièrement simple. Est-ce qu’onpeut trouver des critères assez simples pour d’autres nombres ? Par exemple, supposons qu’oncherche un critère de divisibilité de n par 7. On commence avec l’étude des puissances de 10.On a que

100 = 1 ≡ 1 (mod 7)

101 = 10 ≡ 3 (mod 7)

102 ≡ 32 (mod 7) ≡ 2 (mod 7)

103 = 10 · 102 ≡ 3 · 2 (mod 7) ≡ 6 (mod 7) ≡ −1 (mod 7)

104 = 10 · 103 ≡ 3 · (−1) (mod 7) ≡ −3 (mod 7)

105 = 10 · 104 ≡ 3 · (−3) (mod 7) ≡ −2 (mod 7)

106 = 10 · 105 ≡ 3 · (−2) (mod 7) ≡ 1 (mod 7).

On arrête ici parce que 106 ≡ 100 (mod 7). Ceci veut dire que les puissances de 10 sont6-périodiques modulo 7. En effet, on a que 10k+6 = 10k106 ≡ 10k (mod 7). Donc on trouve

Page 30: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

30 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

que

n ≡ (a0 + 3a1 + 2a2 − a3 − 3a4 − 2a5) + (a6 + 3a7 + 2a8 − a9 − 3a10 − 2a11) + · · · (mod 7)

≡ (a0 + 3a1 + 2a2)− (a3 + 3a4 + 2a5) + (a6 + 3a7 + 2a8)− (a9 + 3a10 + 2a11)± · · · (mod 7)

ce qui implique que 7 divise n si et seulement si 7 divise (a0+3a1+2a2)−(a3+3a4+2a5)±· · · .

On peut généraliser cette procedure. Supposons que le nombre n est donné dans la basede b, c’est-à-dire n = (crcr−1 · · · c0)b pour quelques nombres c0, c1, . . . , cr ∈ 0, 1, . . . , b − 1ou, de façon équivalente,

n = c0 + c1b+ · · ·+ cr−1br−1 + crb

r.

Supposons aussi qu’on veut déterminer si n est divisé par un nombre donné d. Le corollaire 2.6implique que pour chaque j ≥ 0, on peut trouver βj ∈ Z∩(−d/2, d/2] tel que bj ≡ βj (mod d).Donc

n ≡ c0β0 + c1β1 + · · ·+ crβr (mod d).

C’est une relation très utile parce qu’elle nous permet de réduire la divisibilité de n, unnombre de magnitude ≈ br, à la divisibilité de c0β0 + c1β1 + · · · + crβr, un nombre demagnitude ≤ r · (b− 1) · d/2 qui est considérablement plus petit que br (à condition que d nesoit pas énorme). De plus, on a un avantage additionnel : on peut calculer la séquence βj avec≤ 2d operations. En effet, les d+ 1 nombres b0, b1, . . . , bd ne peuvent pas être tous distinctsmodulo d car il existe seulement d distincts classes d’équivalences modulo d. Donc il existedeux nombres i0 et k tels que 0 ≤ i0 < i0 + k ≤ d et que bi0 ≡ bi0+k (mod d). C’implique quela suite βii≥1 est k-périodique pour i ≥ i0 : si i ≥ i0, on a que

βi+k ≡ bi+k (mod d) ≡ bi−i0bi0+k (mod d) ≡ bi−i0bi0 (mod d) ≡ bi (mod d) ≡ βi (mod d).

Puisque −d/2 < βi+k, βi ≤ d/2, alors on déduit que βi+k = βi, pour tout i ≥ i0. C’im-plique qu’il suffit de calculer les nombres β0, β1, . . . , βi0+k−1 ; les autres sont déterminés parpériodicité. Finalement, on remarque qu’on peut choisir les nombres i0 et k dans une façonminimale : on peut supposer que i0 est le minimum nombre i ≥ 0 pour lequel il existe un` ≥ 1 tel que bi ≡ bi+` (mod d). Ayant choisi i0, on choisit k d’être le minimum nombre telque bi0+k ≡ bi0 (mod d).

Remarque 2.12. Si (b, d) = 1, alors la relation bi ≡ bi+` (mod d) et le lemme 2.8(b) impliqueque b` ≡ 1 (mod d). On déduit que dans ce cas on peut toujours choisir i0 = 0 et k ≤ d− 1.Comme on verra au chapitre ??, le nombre minimum k ≥ 1 pour lequel bk ≡ 1 (mod d) estappelé l’ordre multiplicative de b modulo d.

On donne un autre exemple concret pour démontrer la procedure décrite ci-dessus. Soitn = (cr · · · c1c0)2 un nombre dans la base binaire, c’est-à-dire

n = c0 + c12 + · · ·+ cr−12r−1 + cr2

r.

Page 31: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.3. LE THÉORÈME DE WILSON 31

On veut déterminer si c’est nombre est divisible par 6. On applique la procedure au-dessus :on a que

20 = 1 ≡ 1 (mod 6)

21 = 2 ≡ 2 (mod 6)

22 = 4 ≡ −2 (mod 6)

23 = 2 · 22 ≡ 2 · (−2) (mod 6) ≡ −4 (mod 6) ≡ 2 (mod 6).

Donc on voit que la suite 2jj≥0 est 2-périodique pour j ≥ 1. Alors

n ≡ c0 + (2c1 − 2c2) + (2c3 − 2c4) + (2c5 − 2c6) + · · · (mod 6)

≡ c0 + 2c1 − 2c2 + 2c3 − 2c4 ± · · · (mod 6).

Alors on conclut que 6|n si et seulement si 6 divise c0 + 2c1− 2c2 + 2c3− 2c4±. Par exemple,si n = (100001111000100111000)2, alors 6 divise n si et seulement si 6 divise

0 + 0− 0 + 2− 2 + 2− 0 + 0− 2 + 0− 0 + 0− 2 + 2− 2 + 2− 0 + 0− 0− 0 + 2 = 4,

ce qui n’est pas vrai. Donc 6 - n.

2.3 Le théorème de WilsonLe premier résultat important de l’arithmétique modulaire qu’on montrera est un théo-

rème jolie grâce à Wilson qui, entre autres, donne une caractérisation des nombres premiers.

Théorème 2.13 (Wilson). Si p est un nombre premier, alors

(p− 1)! ≡ −1 (mod p).

Démonstration. Si p = 2 ou p = 3, le résultat est évident. Supposons maintenant que p ≥ 5.On couple chaque nombre j ∈ 1, . . . , p− 1 avec son inverse mod p, qu’on dénote par j (onsuppose qu’on a choisi j parmi les nombres 1, . . . , p−1). On observe que j et j apparaissentau produit (p − 1)! = 1 · 2 · · · (p − 1) et, donc, il vont s’annuler. Presque... on a menti unpeu. Afin que s’arrive, il faut que j 6= j. Ceci nous amène naturellement à comprendre quandj = j ou, de façon équivalente, quand j · j ≡ 1 (mod p). Alors p|j2− 1 = (j− 1)(j+ 1) et, vuque p est premier, ceci implique que p|j − 1 ou p|j + 1. Donc, on a montré que j = j si, etseulement si, j ≡ ±1 (mod p). Ceci implique que les éléments de l’ensemble 2, 3, . . . , p− 2peut se diviser en pairs de la forme (j, j) avec j 6= j et, par la suite, 2·3 · · · (p−2) ≡ 1 (mod p).On conclut que

(p− 1)! ≡ 1 · (p− 1) ≡ −1 (mod p),

ce qui est ce qu’il fallait démontrer.

Remarque 2.14. L’idée de s’accoupler les éléments de 1, . . . , p − 1 dans de façons ap-propriées pour calculer un produit est très utile. On la reverra quand on étudie les résidusquadratiques.

Page 32: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

32 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

Dans le cas où n est composé (et plus grand que 4), on a le résultat suivant complémen-taire :

Théorème 2.15. Si n > 4 est composé, alors

(n− 1)! ≡ 0 (modn).

Démonstration. Soit n = pv11 · · · pvrr la factorisation première de n.Si r ≥ 2, alors pvjj < n et, donc, pvjj |(n−1)! pour chaque j. On conclut alors que n|(n−1)!

dans ce cas-ci.Supposons, maintenant, que r = 1, c’est-à-dire n = pv pour un nombre premier p et un

exposant v ≥ 2 (car n est composé). On a que p, p2, . . . , pv−1 sont tous < n, donc leur produitdivise (n− 1)!. On a que

p · p2 · · · pv−1 = p1+2+···+(v−1) = pv(v−1)

2 .

On observe que v(v − 1)/2 ≥ v quand v ≥ 3, ce qui conclut la preuve dans ce cas.Il reste à considérer le cas où v = 2, c’est-à-dire n = p2. On a que p > 2 car n > 4. Il faut

montrer que p2|1 ·2 · · · (p2−1). On sait déjà que p se trouve entre les nombres 1, 2, . . . , p2−1,donc on cherche un autre multiple de p entre eux. On observe que 2p < p2 quand p > 2, d’oùp · 2p|(p2 − 1)!. Ceci termine la démonstration.

Corollaire 2.16. Un nombre n > 1 est premier si et seulement si

(n− 1)! ≡ −1 (modn).

Démonstration. Si n est premier, on a que (n − 1)! ≡ −1 (modn), du théorème de Wilson.Si n = 4, alors on a que (4 − 1)! ≡ 2 6≡ −1 (mod 4). Finalement, si n est composé et plusgrand que 4, alors (n− 1)! ≡ 0 6≡ −1 (modn), du théorème 2.15.

2.4 Le théorème des restes chinoisSupposez que vous êtes un empereur possédant un armé énorme, mais vous ne connaissez

pas exactement le nombre de vos soldats. Comment est-ce que vous pouvez le calculez rapi-dement ? Le théorèmes des restes chinois vous offre une solution géniale : soit N le nombrede vos soldats, qui forment une ligne longue. Comme ça, c’est facile d’arranger les soldatsen pairs. À la fin, il reste soit aucun soldat soit un soldat, ce qui implique que N est pairou impair, respectivement. Puis, les soldats forment des triplets. À la fin, il reste 0, 1 ou 2soldats, ce qui détermine le reste de N quand divisé par 3. On continue de cette façon : pourtout nombre premier p plus petit qu’un paramètre z, on arrange les soldats en p-tuples pourtrouver le reste de N quand divisé par p. Le théorème de restes chinois (cf. théorème 2.18)dit que ceci détermine le reste de N modulo m :=

∏p≤z p. Si on choisi la paramètre z pour

que m > N (par exemple, si z = 30, on a que m est à peu prés égal à 6.5 billions, un nombrequi est certainement plus grand que N), alors le reste de N modulo m est, en fait, égal à N ,c’est-à-dire on a déterminé N soi-même !

Avant de montrer le théorème des restes chinois, on établit un lemme préparatoire :

Page 33: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.4. LE THÉORÈME DES RESTES CHINOIS 33

Lemme 2.17 (théorème des restes chinois - version bébé). Soient m1, . . . ,mk ∈ N et x, y ∈Z. On a que

x ≡ y (modm1)...x ≡ y (modmk)

⇔ x ≡ y (mod [m1, . . . ,mk])

Démonstration. On a que x ≡ y (modnj) pour tout j ∈ 1, . . . , k si et seulement si nj|(x−y)pour tout j ∈ 1, . . . , k. D’après l’exercice 1.9, cette relation est équivalente à la relation[m1, . . . ,mk]|(x− y), c’est-à-dire x ≡ y (mod [m1, . . . ,mk]).

On montre maintenant le théorème des restes chinois :

Théorème 2.18 (théorème des restes chinois). Soient m1, . . . ,mk ∈ N tels que (mi,mj) = 1si i 6= j. Soient aussi a1, . . . , ak ∈ Z. Le système de congruences

x ≡ a1 (modm1)...x ≡ ak (modmk)

(2.1)

a une solution unique modulo m1 · · ·mk.

Démonstration. On donne deux arguments :

Première preuve. On pose M = m1 · · ·mk et, pour chaque j ∈ 1, . . . , k, on pose

Mj =M

mj

= m1 · · ·mj−1mj+1 · · ·mk.

L’observation fondamentale est que (mj,Mj) = 1 et que Mj ≡ 0 (modmi) pour i 6= j. Lapremière relation garanti que Mj est inversible mod mj. Soit Nj son inverse. Alors on a que

MjNj ≡ 1j=i (modmi) =

1 (modmj)

0 (modmi) si i 6= j.

Alors le nombre x0 = a1M1N1 + · · ·+ akMkNk est une solution au système (2.1).Il reste de montrer que la solution x0 qu’on a trouvé est unique mod M = m1 · · ·mk.

En effet, si x0 ≡ x1 (modmj), pour tout j ∈ 1, . . . , k, alors le lemme 2.17 implique quex0 ≡ x1 (mod [m1, . . . ,mk]). Finalement, puisque (mi,mj) = 1, en appliquant l’exercice1.9(c), on déduit que [m1, . . . ,mk] = M , c’est-à-dire x0 ≡ x1 (modM), comme affirmé.

Deuxième preuve.On considère d’abord le cas k = 2. On cherche x tel que x ≡ a1 (modm1)et x ≡ a2 (modm2). La forme générale des x satisfaisant la première relation est x = km1+a1.Donc on cherche k tel que

km1 + a1 ≡ a2 (modm2) ⇔ km1 ≡ a2 − a1 (modm2) ⇔ k ≡ m1(a2 − a1) (modm2),

où m1 est l’inverse de m1 modulo m2, qui existe à cause de la co-primalité de m1 et de m2. Sib2 ∈ 0, 1, . . . ,m2−1 est un representant de la classe de congruences m1(a2−a1) (modm2),

Page 34: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

34 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

on trouve que k = `m2+b2. Donc, la solution générale est donnée par x = (`m2+b2)m1+a1 =`m1m2 + (b2m1 + a1), ce qui montre au même temps l’existence et l’unicité mod m1m2 de x.

Le cas général suit par induction : on a transformé le système de congruences x ≡a1 (modm1) et x ≡ a2 (modm2) à une seule congruence, soit x ≡ a (modm1m2). Donc, on apassé d’un système avec k congruences à un système avec k − 1 congruences.

Remarque 2.19. La démonstration du théorème des restes chinois nous donne deux algo-rithmes pour résoudre le système de congruences (2.1).

Dans le premier algorithme, on calcule M = m1 · · ·mk, Mj = M/mj et Nj tels queMjNj ≡ 1 (modmj) en utilisant l’algorithme euclidien. La solution générale est donnée par

x ≡ a1M1N1 + · · · akMkNk (modM).

Dans le deuxième algorithme, on calcule la solution générale en commençant par la solu-tion de la première équation, x = k1m1 + a1, où k1 est une variable libre. Puis, on remplacex par cette expression à la deuxième équation et on trouve la solution générale du systèmeformés par les deux premières équations, soit x = k2m1m2 + a′2, où k2 est une variable libreet a′2 est un nombre déterminé. En continuant de cette façon, on trouve la solution généralau système de congruences x ≡ aj (modmj), 1 ≤ j ≤ k.

Exemple 2.20. Résolvons le système de congruencesx ≡ 1 (mod 5)

x ≡ 3 (mod 4)

x ≡ 2 (mod 3).

(2.2)

Solution. On a que (5, 4) = (4, 3) = (5, 3) = 1. Donc on peut appliquer tout de suitel’algorithme mentionné au remarque 2.19. On a M = 5 · 4 · 3 = 60, M1 = 4 · 3 = 12,M2 = 5 · 3 = 15 et M3 = 5 · 4 = 20. Puis on calcule N1, N2 et N3. On a que

M1N1 ≡ 1 (modm1) ⇔ 12N1 ≡ 1 (mod 5) ⇔ 2N1 ≡ 1 (mod 5)

⇔ N1 ≡ 3 (mod 5),

M2N2 ≡ 1 (modm2) ⇔ 15N2 ≡ 1 (mod 4) ⇔ −N2 ≡ 1 (mod 4)

⇔ N2 ≡ −1 (mod 4)

et

M3N3 ≡ 1 (modm3) ⇔ 20N3 ≡ 1 (mod 3) ⇔ 2N3 ≡ 1 (mod 3)

⇔ N3 ≡ −1 (mod 3).

Donc la solution unique au système (2.2) est

x ≡ 1 · 12 · 3 + 3 · 15 · (−1) + 2 · 20 · (−1) (mod 60) ≡ 11 (mod 60).

Page 35: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.4. LE THÉORÈME DES RESTES CHINOIS 35

De façon alternative, afin de résoudre le système (2.2), on observe que la congruencex ≡ 1 (mod 5) veut dire que x = 5y+1, pour un y ∈ Z. Avec cette substitution, la congruencex ≡ 3 (mod 4) devient

5y + 1 ≡ 3 (mod 4) ⇔ y ≡ 2 (mod 4),

c’est-à-dire y = 4z + 2. Donc x = 5(4z + 2) + 1 = 20z + 11 et la congruence x ≡ 2 (mod 3)devient

20z + 11 ≡ 2 (mod 3) ⇔ 2z ≡ 0 (mod 3) ⇔ z ≡ 0 (mod 3).

Par la suite, z = 3w, ce qui implique que x = 60w+11. C’est la solution générale au systèmede congruences (2.2), qu’on peut réécrire comme x ≡ 11 (mod 60), comme avant.

Exemple 2.21. Résolvons le système de congruencesx ≡ 1 (mod 6)

x ≡ 4 (mod 15)(2.3)

Solution. Ici on a que (6, 15) = 3 > 1, donc on ne peut appliquer directement l’algorithmementionné au remarque 2.19. On écrit factorise 6 et 15 en termes de leurs plus grand communfacteur : 6 = 2 · 3 et 15 = 3 · 5. Puis, on observe que le lemme 2.17 implique que

x ≡ 1 (mod 6)

x ≡ 4 (mod 15)⇔

x ≡ 1 (mod 2)

x ≡ 1 (mod 3)

x ≡ 4 (mod 3)

x ≡ 4 (mod 5)

x ≡ 1 (mod 2)

x ≡ 1 (mod 3)

x ≡ 4 (mod 5)

x ≡ 1 (mod 6)

x ≡ 4 (mod 5)

puisque les congruences x ≡ 4 (mod 3) et x ≡ (mod 3) sont, en fait, la même congruence.Maintenant on est en position d’appliquer l’algorithme du remarque 2.19 au dernier système,puisque (5, 6) = 1. On a M = 5 · 6 = 30, M1 = 5 et M2 = 6. Puis on calcule N1 et N2. On aque

M1N1 ≡ 1 (modm1) ⇔ 5N1 ≡ 1 (mod 6) ⇔ N1 ≡ −1 (mod 6)

et

M2N2 ≡ 1 (modm2) ⇔ 6N2 ≡ 1 (mod 5) ⇔ N2 ≡ 1 (mod 5).

Donc la solution unique au système (2.3) est

x ≡ 1 · 5 · (−1) + 4 · 6 · 1 (mod 30) ≡ 19 (mod 30).

Alternativement, afin de résoudre le système (2.2), on observe que x ≡ 1 (mod 6) si etseulement si x = 6y + 1. Donc la congruence x ≡ 4 (mod 15) devient

6y + 1 ≡ 4 (mod 15) ⇔ 6y ≡ 3 (mod 15) ⇔ 2y ≡ 1 (mod 5) ⇔ y ≡ 3 (mod 5),

Page 36: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

36 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

où on a utilisé le lemme 2.8(a). Donc y = 5z + 3, ce qui implique que x = 6(5z + 3) + 1 =30z + 19, c’est-à-dire la solution générale au système (2.3) est x ≡ 19 (mod 30).

Exemple 2.22. Résolvons le système de congruencesx ≡ 1 (mod 5)

x ≡ 2 (mod 10)

x ≡ 3 (mod 7).

(2.4)

Solution. On a que (5, 10) = 5 > 1. Donc on écrit 10 = 5 · 2 et on observe que

x ≡ 1 (mod 5)

x ≡ 2 (mod 10)

x ≡ 3 (mod 7)

x ≡ 1 (mod 5)x ≡ 2 (mod 2)

x ≡ 2 (mod 5)

x ≡ 3 (mod 7)

x ≡ 1 (mod 5) et x ≡ 2 (mod 5)

x ≡ 0 (mod 2)

x ≡ 3 (mod 7)

Le dernière système de congruences n’a pas de solutions parce que les relations x ≡ 1 (mod 5)et x ≡ 2 (mod 5) sont mutuellement exclusives. Donc le système (2.4) ne possède pas desolutions.

Exemple 2.23. Résolvons le système de congruences3x ≡ 3 (mod 27)

3x ≡ 2 (mod 5)

x ≡ 7 (mod 21).

(2.5)

Solution. Ici on a deux problèmes. D’abord, on a que x est multiplié par 3 en deux instances.Cependant, on a que

3x ≡ 3 (mod 27) ⇔ x ≡ 1 (mod 9)

selon le lemme 2.8(a) et que

3x ≡ 2 (mod 5) ⇔ x ≡ 3−1 · 2 (mod 5) ⇔ x ≡ 4 (mod 5),

puisque 3−1 ≡ 2 (mod 5). Donc le système (2.5) est équivalent au systèmex ≡ 1 (mod 9)

x ≡ 4 (mod 5)

x ≡ 7 (mod 21)

(2.6)

Mais même maintenant on ne peut pas appliquer l’algorithme du remarque 2.19 parce que(9, 21) = 3 > 1. Donc on écrit 9 et 21 en termes de leur plus grand diviseur, c’est-à-dire9 = 3 · 3 et 21 = 3 · 7. Cependant, ici

x ≡ 1 (mod 9) 6⇔

x ≡ 1 (mod 3)

x ≡ 1 (mod 3)

Page 37: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.4. LE THÉORÈME DES RESTES CHINOIS 37

car (3, 3) = 3 > 1. En fait, ce qu’il faut faire est de trouver les factorisations premières de 9et 21, qui sont 9 = 32 et 21 = 3 · 7. Puis on peut dire que

x ≡ 1 (mod 9)

x ≡ 4 (mod 5)

x ≡ 7 (mod 21)

x ≡ 1 (mod 32)

x ≡ 4 (mod 5)x ≡ 7 (mod 3)

x ≡ 7 (mod 7)

x ≡ 1 (mod 32) et x ≡ 1 (mod 3)

x ≡ 4 (mod 5)

x ≡ 0 (mod 7)

Finalement, on observe que la relation x ≡ 1 (mod 32) implique la relation x ≡ 1 (mod 3).Par conséquent, on trouve que

x ≡ 1 (mod 9)

x ≡ 4 (mod 5)

x ≡ 7 (mod 21)

x ≡ 1 (mod 9)

x ≡ 4 (mod 5)

x ≡ 0 (mod 7)

Ce dernière système peut se traiter selon l’algorithme du remarque 2.19 : on a que M =9 · 5 · 7 = 315, M1 = 5 · 7 = 35, M2 = 9 · 7 = 63 et M3 = 9 · 5 = 45. Puis on trouve N1, N2 etN3 : on a que

M1N1 ≡ 1 (modm1) ⇔ 35N1 ≡ 1 (mod 9) ⇔ N1 ≡ −1 (mod 9),

M2N2 ≡ 1 (modm2) ⇔ 63N2 ≡ 1 (mod 5) ⇔ 3N2 ≡ 1 (mod 5)

⇔ N2 ≡ 2 (mod 5)

et

M3N3 ≡ 1 (modm3) ⇔ 45N3 ≡ 1 (mod 7) ⇔ 3N3 ≡ 1 (mod 7)

⇔ N3 ≡ −2 (mod 7).

Donc la solution unique au système (2.2) est

x ≡ 1 · 35 · (−1) + 4 · 63 · 2 + 0 · 45 · (−2) (mod 315) ≡ 154 (mod 315).

Alternativement, afin de résoudre le système (2.2), on observe que x ≡ 1 (mod 9) si etseulement si x = 9y + 1 pour un y ∈ Z. Donc on a que

x ≡ 4 (mod 5) ⇔ 9y + 1 ≡ 4 (mod 5) ⇔ y ≡ 2 (mod 5),

c’est-à-dire y = 5z + 2. Par la suite, x = 9(5z + 2) + 1 = 45z + 19, ce qui implique que

x ≡ 7 (mod 21) ⇔ 45z + 19 ≡ 7 (mod 21) ⇔ 3z ≡ 9 (mod 21) ⇔ z ≡ 3 (mod 7).

Donc z = 7w + 3, ce qui implique que x = 45(7z + 3) + 19 = 315w + 154, c’est-à-dire lasolution générale du système (2.6) est x ≡ 154 (mod 315).

Page 38: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

38 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

La fonction d’Euler

Rappelez que la fonction d’Euler φ(n) est définie d’être la cardinalité de l’ensemble desrésidus réduits, c’est-à-dire

φ(n) = #(Z/nZ)∗ = #1 ≤ a ≤ n : (a, n) = 1.

On montre maintenant quelques propriétés-clés de φ.On commence par le calcul de quelques valeurs. Si p est premiers, on a que (a, p) = 1 si

et seulement si p - a. Donc

φ(p) = #1 ≤ a ≤ p : p - a = p− 1,

puisque chaque nombre entre 1 et p−1 n’est pas divisible par p. En généralisant cet argument,on observe que si k est n’importe quel nombre naturel, on a que (a, pk) = 1 si et seulementsi p - a. Par conséquent,

φ(pk) = pk −#1 ≤ a ≤ pk : p|a = pk − pk−1

car les multiples de p entre 1 et pk sont les nombres 1 · p, 2p, 3p, . . . , pk−1 · p.On calcule maintenant φ(pq), où p et q sont deux nombres premiers distincts. On a que

φ(pq) = #1 ≤ n ≤ pq : p, q - n = pq −#1 ≤ n ≤ pq : p|n ou q|n

Les nombres n ∈ 1, . . . , pq qui sont divisibles par p sont p, 2p, 3p, . . . , qp, et les n divisiblespar q sont q, 2q, 3q, . . . , pq. La seule coincidence entre ces deux listes est le nombre pq : eneffet, si p, q|n, alors pq|n car p et q sont premiers distincts. En particulier, il faut que n ≥ pq.On en déduit que

φ(pq) = pq − (p+ q − 1) = pq − p− q + 1 = (p− 1)(q − 1).

Cette factorisation de φ(pq) n’est pas un accident :

Théorème 2.24. Si (m,n) = 1, alors φ(mn) = φ(m)φ(n), c’est-à-dire la fonction φ estmultiplicative.

Démonstration. Soit f : (Z/mnZ)∗ → (Z/mZ)∗ × (Z/nZ)∗ définie par f(x (modmn)) :=(x (modm), x (modn)). On a que :

— (x,mn) = 1 si et seulement si (x,m) = (x, n) = 1 ;— x ≡ y (modmn), si et seulement si x ≡ y (modm) et x ≡ y (modn), par le lemme 2.17.

Ces relations montrent que la fonction f est bien définie, ainsi qu’elle est injective. Fina-lement, on montre que f est surjective : soit (a,m) = 1 et (b, n) = 1. Par le théorèmedes restes chinois, il existe x (modmn) tel que x ≡ a (modm) et x ≡ b (modn). Doncf(x (modmn)) = (a (modm), b (modn)), comme voulu. Ceci montre que f est une bijection.Par la suite

φ(mn) = #(Z/mnZ)∗ = # ((Z/mZ)∗ × (Z/nZ)∗) = #(Z/mZ)∗ ·#(Z/nZ)∗ = φ(m)φ(n),

ce qui conclut la démonstration.

Page 39: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.4. LE THÉORÈME DES RESTES CHINOIS 39

Corollaire 2.25. On a que

φ(n) = n∏p|n

(1− 1

p

).

Démonstration. Ceci découle directement de la multiplicativité de n : si la factorisationpremière de n est donnée par n = pv11 · · · p

vkk , alors les nombres pv11 , . . . , p

vkk sont deux à deux

copremiers, d’où

φ(n) =k∏j=1

φ(pvjj ).

Puisque φ(pvjj ) = p

vjj − p

vj−1j = p

vjj (1 − 1/pj), comme on l’a vu avant, la formule affirmée

pour φ(n) en suit.

Démonstration combinatoire. Soit n = pv11 · · · pvkk comme ci-dessus. On observe que

φ(n) = #1 ≤ a ≤ n : pj - n ∀j.

Soit X = 1 ≤ a ≤ n et Ej = 1 ≤ a ≤ n : pj|n. Alors, on cherche la cardinalité del’ensemble X \ ∪kj=1Ej. D’après la principe d’inclusion-exclusion, on a que

φ(n) = |X| −k∑j=1

|Ej|+∑

1≤j1<j2≤k

|Ej1 ∩ Ej2| −∑

1≤j1<j2<j3≤k

|Ej1 ∩ Ej2 ∩ Ej3 | ± · · ·

=∑

J⊂1,2,...,k

(−1)|J |∣∣∣ ⋂j∈J

Ej

∣∣∣,où ∩j∈∅Ej = X par convention. Si J = j1, . . . , j`, alors⋂

j∈J

Ej = 1 ≤ a ≤ n : pj1 , . . . , pj` |a = 1 ≤ a ≤ n : pj1 · · · pj`|a

puisque les nombres premiers pj1 , . . . , pj` sont distincts. En écrivant a = bpj1 · · · pj` , on trouvealors que ∣∣∣ ⋂

j∈J

Ej

∣∣∣ = #b ≤ n/pj1 · · · pj` =n

pj1 · · · pj`,(2.7)

d’oùφ(n)

n=

∑J⊂1,2,...,k

(−1)|J |∏j∈J

1

pj=

∑J⊂1,2,...,k

∏j∈J

−1

pj.

On affirme que cette expression est égale à (1 − 1/p1) · · · (1 − 1/pk). En effet, quand ondéveloppe ce produit, on trouve une somme de 2k termes de la forme (−1/pj1) · · · (−1/pj`),déterminés par les sous-ensembles J = j1, . . . , j` de 1, . . . , k, où la correspondence estqu’on choisit soit −1/pj soit 1 dans la parenthèse (1− 1/pj), dépendant de si j ∈ J ou non,respectivement. Ceci conclut la démonstration combinatoire du théorème.

Page 40: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

40 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

Démonstration probabiliste. On réécrit (2.7) comme

|⋂j∈J Ej||X|

=∏j∈J

1

pj=∏j∈J

|Ej||X|

.(2.8)

Si on interprète le quotient P(E) := |E|/|X| comme la probabilité de l’ensemble E ⊂ X, larelation (2.8) implique que les événements Ej, 1 ≤ j ≤ k, sont mutuellement indépendants.Donc

φ(n)

n= P

(k⋂j=1

Ecj

)=

k∏j=1

P(Ecj ) =

k∏j=1

(1− P(Ej)) =k∏j=1

(1− 1

pj

).

Remarque 2.26. On peut essayer d’utiliser l’approche probabiliste pour donner une ap-proximation à la quantité de nombres premiers ≤ x. En effet, les nombres premiers p sontdes objets définis par des exclusions ; les exclusions de la divisibilité par tous les nombresdans l’intervalle ouvert (1, p). En fait, le crible d’Eratosthenes nous dit qu’il suffit d’exclurela divisibilité de p par les premiers dans l’intervalle [1,

√p]. Ceci implique la formule

#√x < p ≤ x = #1 < n ≤ x : p|n ⇒ p >

√x.

Motivés par l’argument probabiliste qu’on présenté ci-dessus, on pose Ep = 1 < n ≤ x : p|net on suppose que les événements Ep sont quasi-indépendants de probabilité ≈ 1/p. On peutdonc conjecturer que

#√x < p ≤ x ≈ x

∏p≤√x

(1− 1

p

).

Cependant, comme on le verra au chapitre 7, le côté gauche est asymptotique à x/ log x,et le côté droit à cx/ log x, pour une constante c > 1. On voit alors que notre hypothèsed’indépendance n’est pas correcte ici. Le problème est que les événements Ep sont très corréléspour de grands nombres premiers. Par exemple, si n ∈ (1, x] et p1, p2, p3 > x1/3, alors on saitqu’au moins un pj ne divise pas n ; sinon, on aurait que n ≥ p1p2p3 > x, ce qui est absurd.On voit alors que Ep1 ∩ Ep2 ∩ Ep3 = ∅.

Théorème 2.27 (Théorème d’Euler). Si (a, n) = 1, alors

aφ(n) ≡ 1 (modn).

Démonstration. On sait que (Z/nZ)∗ = k (modn) : 1 ≤ k ≤ n, (k, n) = 1. Puisque(a, n) = 1, on sait aussi que les nombres a, 2a, . . . , na forment un système complet de résidusmod n. De plus, (ak, n) = 1 si et seulement si (k, n) = 1. Donc (Z/nZ)∗ = ak (modn) : 1 ≤k ≤ n, (k, n) = 1. On trouve alors que∏

1≤k≤n(k,n)=1

k ≡∏

1≤k≤n(k,n)=1

ak (modn)

Page 41: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.4. LE THÉORÈME DES RESTES CHINOIS 41

Si on le pose m =∏

1≤k≤n(k,n)=1

k, alors le côté gauche se factorise comme

ma#1≤k≤n:(k,n)=1 = maφ(n).

Donc

maφ(n) ≡ m (modn).(2.9)

Puisquem est le produit de quelques résidus réduits, il est copremier avec n. Doncm−1 (modn)existe, et le théorème découle d’éliminant m dans la relation (2.9).

En prenant n = p, un premier, on arrive tout de suite au résultat suivant :

Corollaire 2.28 (Petit théorème de Fermat). Si p - a, alors

ap−1 ≡ 1 (mod p).

L’algorithme RSA

La théorie des nombres a plusieurs applications pratiques, particulièrement sur la cryp-tographie. La cryptographie existe depuis long temps, parce que le besoin de transmettre demessages d’une façon sécuritaire est aussi vieux que la civilisation humaine. Par exemple, ilexiste un algorithme de cryptage inventé par Jules Cesar. L’algorithme est facile : il se basesur une permutation donné des lettres de l’alphabet. Toutefois, c’est facile de décrypter telsalgorithmes, spécialement si le message est assez long : on peut utiliser une combinaison desstatistiques sur les lettres qui sont les plus fréquentes ou des mots fréquentes (articles, pre-positions, les verbes “avoir” et “être” et ses conjugaisons, etc.) et deviner quels sont quelqueslettres.

Avec le temps, les méthodes de cryptage ont évolues et, aujourd’hui, elles se basent surdes méthodes arithmétiques. De façon générale, quand on veut transmettre un message defaçon sécuritaire, il y a trois choses qu’il faut assurer :

— l’expéditeur du message doit être capable de le crypter rapidement ;— un adversaire ne doit pas pouvoir décrypter le message transmis rapidement et lire le

message original ;— il faut que le destinataire ait accès à une clé de décryptage qui lui permettra de dé-

crypter le message rapidement.

Habituellement, on utilise les noms Alice (Personne A) pour l’expéditeur du message, Bob(Personne B) pour le destinataire et Eve (Evil Eve, de l’anglais) pour l’adversaire.

On peut aussi formaliser les procedures de cryptage et de décryptage. Soit X l’ensemblede tous les messages possibles de k lettres. Le cryptage est une bijection f : X → X et ledécryptage est la fonction réciproque f−1 : X → X. Donc si on veut transmettre un messagede x lettres, on le divise en paquets de k lettres ou mois chaque, soit x = x1x2 · · ·xn, oùchaque xi a ≤ k lettres, et on envoie le message f(x1)f(x2) · · · f(xn). Bob possède une cléqui lui permettre de calculer rapidement f−1(f(xi)) = xi pour tout i. Puisque Eve n’a pas

Page 42: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

42 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

accès à cette clé, la procedure de décryptage (c’est-à-dire de trouver xi à partir de f(xi))doit être difficile. 1

Les premiers cryptosystèmes développés se basaient sur la cryptographie de clé privée,appelée aussi cryptographie symétrique. Dans ce scheme, les clé de cryptage et de décryptagesont les deux privées et échangées entre Alice et Bob avant l’échange des messages. Certai-nement, l’échange des clés entre Alice et Bob devait être fait d’une façon sécuritaire aussi.Ceci est facile dès que Alice et Bob ont établit une communication sécuritaire : Alice peutcréer un nouveau pair de clés et l’envoyer à Bob en utilisant les vieilles clés, déjà établies.Cependant, ce scheme souffre de plusieurs déficiences. Premièrement, si Eve peut découvrirla clé de décryptage seulement une fois, elle pourra lire toutes les communications futures.Par exemple, pendant la seconde guerre mondiale, les Allemagnes avaient développés uncryptosystème appelé Enigma. Les clés de cryptage et de décryptage étaient changées pério-diquement en utilisant les vieilles clés. Une équipe de mathématiciens britanniques, amenéepar Alan Turing, a réussi d’exploiter ce trou et de décrypter Enigma, un fait qui était d’im-portance cruciale pour le résultat de la guerre. Une autre déficience de la cryptographie declé privée est que, avant leur première communication, Alice et Bob doivent se rencontrerau mois une fois pour échanger les clés de cryptage et de décryptage, ou de trouver unefaçon sécuritaire différente pour le faire. Bien sûr, ceci pourrait être très compliqué si, parexemple, on suppose que Alice est une personne en Italie qui veut envoyer quelques informa-tions confidentielles à Bob, qui est une banque à la Chine. Il sera très difficile d’échanger lesclés sans contact physique, qui est également difficile grâce à la distance géographique entrel’Italie et la Chine !

La vraie revolution dans le domaine de la cryptographie est venue avec la naissance dela cryptographie de clé publique, aussi appelée cryptographie asymétrique. Ce protocol decryptographie, proposé par Ralph Merkle, utilise un scheme de communication asymétrique.Dans ce scheme, Bob, le récipient crée deux clés : une clé de décryptage, qui est privée etlaquelle Bob garde pour lui-même, et une clé de cryptage, qui est publique. C’est-à-dire,Bob publie la fonction f : X → X, qui crypte les informations, mais il garde secrete lafonction réciproque f−1 : X → X. Puis, Alice utilise la fonction f pour crypter son messageet l’envoyer à Bob, qui peut maintenant le décrypter avec la fonction f−1. Ce scheme decommunication enlève l’exigence de l’exchange des clés de cryptage et de décryptage entreAlice et Bob. Cependant, il rende la communication moins sécuritaire : Eve peut, en théorie,calculer f−1 à partir de f . L’hypothèse-clé de Merkle est que calculer f−1 est, en pratique,difficile si le seul donné est la fonction f . Il a développé un tel algorithme, et un autre exemplea été trouvé plus tard par Diffie et Hellman. Aujourd’hui, on appelle souvent le scheme de lacryptographie de clé publique l’echange de clés de Diffie-Hellman-Merkle. On décrit ici unexemple très important d’un tel algorithme, appelé l’algorithme RSA. Il a été publié en 1978par Rivest, Shamir et Adleman.

Supposons que Alice veut envoyer un message M à Bob, qui a accès à une liste de grandsnombres premiers. En utilisant cette liste, Bob forme un nombre n de la forme pq, où p et qsont deux nombres premiers de taille similaire. Bob, qui sait les nombres premiers premiers

1. La fonction f est une permutation. Donc, en principe, on peut trouver son inverse si on possède assezinformations, mais ceci pourrait prendre beaucoup de temps. Le but d’Alice et de faire sûr que le messageenvoyé reste protégé pour le temps maximal possible.

Page 43: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.4. LE THÉORÈME DES RESTES CHINOIS 43

p et q, peut aussi calculer φ(n) = (p − 1)(q − 1) = n + 1 − p − q. Avec cette information,il calcule aussi un exposant E tel que (E, φ(n)) = 1. Bob publie le pair (E, n) ; c’est la clépublique que Alice utilise pour crypter son message. Pour le faire, elle calcule le résidu deME mod n, soit C ∈ 0, 1, . . . , n−1. Le résultat est le message crypté qu’elle envoie à Bob.

La question est maintenant, comment va Bob décrypter le message ? La clé est le théorèmed’Euler : si (M,n) = 1, alors Mφ(n) ≡ 1 (modn). Donc, il suffit que Bob calcule un nombreF tel que EF ≡ 1 (modφ(n)), car dans ce cas EF = 1+kφ(n) et, par la suite, CF = MEF =M ·(Mφ(n))k ≡M (modn). Donc, en calculant CF (modn), Bob peut déterminerM (modn).Pour déterminer la valuer exacte de M , il faut s’assurer que le nombre n > M , pour quele reste de M mod n est égal à M . Alternativement (et plus efficacement pour les messageslongues), Bob peut produire une liste de clés publiques (nj, Ej), j ≤ J , où n1, . . . , nk sontmutuellement co-premiers, et calculer M (modnj) pour tout j. En appliquant le théorèmedes restes chinois, il peut alors calculer M (modn1 · · ·nk). Si M < n1 · · ·nk, il a réussi àcalculer M soi-même.

Il reste trouver une façon rapide de calculer le nombre F . Puisque ce nombre est de-terminer par la relation EF ≡ 1 (modφ(n)), il faut simplement inverser E (modφ(n)).Ceci est facile par l’algorithme euclidien, pourvu qu’on connait E et φ(n). Tout le mondeconnait E (cela fait partie de la clé publique), et Bob connait p et q, donc il connaitφ(n) = (p− 1)(q− 1) = n+ 1− p− q. Les nombres (E, n) forment alors la clé publique et lenombre F la clé privée (qui peut être calculée rapidement si on connait φ(n)).

On doit vérifier que les trois principes mentionnées au deuxième paragraphe sont sa-tisfaites. Tout d’abord, est-ce que c’est possible de calculer rapidement ME (modn) etCF (modn) ? La réponse est affirmative et on l’explique dans le premier cas. Soit E =e0 + e12 + e22

2 · · ·+ ek2k l’expansion binaire de E. Alors

ME = M e0(M2)e1 · · · (M2k)ek .(2.10)

On sait les chiffres e0, e1, . . . , ek (habituellement, on travail avec l’expansion binaire dans unordinateur ; en tout cas, c’est facile de calculer l’expansion de M à la base b, pour n’importequel b). Donc il suffit de calculer les puissances M,M2,M4, . . . ,M2k modulo n, ce qu’onpeut faire facilement dans une façon iterative : d’abord, on trouve le reste de M mod n,soit M0 ∈ 0, 1, . . . , n − 1. Puis, on calcule M2

0 et on trouve son reste mod n, soit M1. Engénéral, étant donné Mi ∈ 0, 1, . . . , N − 1 tel que Mi ≡ M2i (modN), on trouve Mi+1 ∈0, 1, . . . , N−1 tel queMi+1 ≡M2

i ≡M2i+1(modn). Étant donnéMi, on a besoin seulement

d’une operation pour trouver Mi+1. Donc, par induction, on a besoin de k + 1 operationspour trouver M2i (modN), pour tout i ∈ 0, 1, . . . , k. Puis, on remplace M2i par Mi dans(2.10), et on calculer ME (modN) avec ≤ 2(k+ 1) operations. Puisque k = blogE/ log 2c, lacalculation deME (modn) exige . logE operations. De même, la calculation de CF (modn)exige ≈ logF operations. On peut supposer que 1 ≤ E,F ≤ φ(n) ≤ n, donc le calcul deME (modn) et de CF (modn) nécessite . log n approximations, une fonction linéaire dunombre de chiffres binaires de n.

On a vu que, étant données les clés publiques et privées, le cryptage et le décryptage dumessage M est très rapide. Cependant, on est aussi intéressé de la sécurité de l’algorithme.Eve a accès à la clé publique (n,E). Supposons aussi qu’elle a aussi réussi à lire le message

Page 44: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

44 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

crypté C ≡ ME (modn). Est-ce qu’elle peut deviner M à partir de ces informations ? Lafaçon évidente pour le faire est d’essayer de calculer l’exposant F , c-est-à-dire la clé privée.Afin de l’accomplir, elle a besoin de connaître la valuer de φ(n) = n+ 1− p− q. Puisque elleconnait déjà n = pq, il suffit de trouver la valeur de p+ q. Mais c’est la même chose que deconnaître les premiers p et q, c’est-à-dire la factorisation première de n. Donc si Eve pouvaitfactoriser n rapidement, elle aurait accès au message crypté M . L’algorithme RSA s’appuiesur l’hypothèse qu’il est difficile de factoriser n, c’est-à-dire qu’il n’existe pas d’algorithmerapide pour le faire. Le meilleur algorithme connu présentement pour la factorisation de n abesoin de

≈ exp

3

√64

9(log n)1/3(log log n)2/3

opérations au pire cas (et le pire cas consiste à un nombre n qui est le produit de deuxnombres premiers p et q qui sont de taille similaire). C’est un algorithme exponentielle (aunombre de chiffres de n), donc il est assez lent, ce qui veut dire que Eve ne peut pas trouverF facilement. Le problème de factoriser un nombre donné est central à la cryptographie.En général, il est cru qu’un algorithme très rapide (‘polynomial’ au nombre de digits de n)n’existe pas, mais ceci est juste une espérance et non un théorème.

2.5 Équations polynomiales

Supposons que f(x) = adxd+ad−1x

d−1+· · ·+a1x+a0 est un polynôme dont les coefficientsad, . . . , a0 sont entiers. On veut étudier ses racines mod n. Une motivation pour le faire estpour étudier ses racines entières : si f(α) = 0 pour un α ∈ Z, alors f(α) ≡ 0 (modn),pour tout n. Par exemple, on peut utiliser cette observation pour montrer que le polynômex3+x+1 n’a pas de racines sur Z : on observe que x3+x+1 ≡ 1 (mod 2) pour chaque x, doncx3 + x + 1 n’a pas de racines dans Z/2Z et a fortiori dans Z. Si on veut étudier les racinesrationnelles de Z, on suppose que x = a/b avec (a, b) = 1 est une telle racine et on multipliel’équation f(a/b) = 0 par b3 pour trouve que a3 + ab2 + b3 = 0. On a alors une équationpolynomiale en deux variables sur Z. Afin de l’étudier, on peut la réduire mod n, pour unnombre convenant n. Par exemple, si on la réduit mod a, on trouve que b3 ≡ 0 (mod a). Mais(a, b) = 1, donc ceci est impossible. On a montré alors que l’équation x3 + x + 1 n’a pas desolutions rationnelles.

Supposons maintenant qu’on veut étudier l’équation polynomiale générale f(x) ≡ 0 (modn).On observe tout d’abord que si x ≡ y (modn), alors xj ≡ yj (modn) pour chaque j. Puisquef(x) est une combinaison linéaire de puissances de x, on trouve que f(x) ≡ f(y) (modn).Ceci veut dire que la valeur de f(x) (modn) dépende juste de la classe de x (modn). Enparticulier, on peut définir

Rf (n) := x ∈ Z/nZ : f(x) ≡ 0 (modn) et ρf (n) := #Rf (n).

Considérons maintenant la factorisation première de n, soit n = pv11 · · · pvkk . La version bébé

Page 45: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.5. ÉQUATIONS POLYNOMIALES 45

du théorème de restes chinois implique que

x (modn) ∈ Rf (n) ⇔ f(x) ≡ 0 (modn) ⇔

f(x) ≡ 0 (mod pv11 )...f(x) ≡ 0 (mod pvkk )

x (mod p

vjj ) ∈ Rf (p

v11 )

...x (mod p)

vjk ∈ Rf (p

vjj ).

D’après le théorème de restes chinois, chaque k-tuple (x1, . . . , xk) ∈ Rf (pv11 )×Rf (p

vkk ) définit

un unique résidu x (modn). En particulier, on a montré que la fonction ρf est multiplica-tive.

On voit alors que l’étude des équations polynomials mod n se réduit à l’étude de ceséquations quand n est une puissance d’un premier, soit pv. Le cas difficile est v = 1, parceque dans cette section on verra une façon de trouver toutes les solutions mod pv, v ≥ 1,si on connait déjà les solutions mod p. Avant de le faire, on montre un résultat qui nouspermet de controller le nombre de solutions mod p. Il est l’analogie d’un résultat bien connuen concernant les racines des polynômes dont les coefficients sont de nombres réels.

Théorème 2.29. Soit f(x) = adxd + ad−1x

d−1 + · · ·+ a1x + a0 ∈ Z[x] et soit p un nombrepremier ne divisant pas tous les coefficients aj de f . Si

Rf (p) = α1 (mod p), . . . , αr (mod p),

où r ≥ 0, alors il existe de nombres m1, . . . ,mr ∈ N et un polynôme g(x) ∈ Z[x] de degréd−

∑rj=1mj tels que :

(a) g(x) 6≡ 0 (mod p), pour tout x ;

(b) les polynômes f(x) et (x− α1)m1 · · · (x− αr)mrg(x) ont les mêmes coefficients mod p.

En particulier, ρf (p) ≤∑r

j=1mj ≤ d.

Démonstration. Sans perte de généralité, on peut supposer que p - d ; sinon, on trouvem = max0 ≤ j ≤ d : p - aj et on montre le théorème pour le polynôme amxm+· · ·+a1x+a0,qui a les mêmes racines avec f mod p.

On utilise induction sur d. Si d = 0, nécessairement f(x) = a0 6≡ 0 (mod p) pour chaquex ∈ Z de notre hypothèse que au moins un coefficient de f (le coefficient a0 dans ce cas-ci) n’est pas divisible par p. Alors on peut prendre g(x) = f(x) et le résultat en découle.Supposons maintenant que le résultat est vrai pour tous les polynômes de degré < d. Sil’ensemble Rf (p) est vide, on peut prendre g(x) = f(x) pour déduire le théorème. Sinon,

Page 46: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

46 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

soit α (mod p) ∈ Rf (p). On observe que x− α est un facteur de f(x)− f(α) : en effet,

f(x)− f(α) =d∑j=0

ajxj −

d∑j=0

ajαj =

d∑j=0

aj(xj − αj)

=d∑j=0

aj(x− α)(xj−1 + xj−2α1 + xj−3α2 + · · ·+ xαj−2 + αj−11 )

= (x− α)f(x),

f(x) :=d∑j=0

aj(xj−1 + xj−2α1 + xj−3α2 + · · ·+ xαj−2 + αj−11 )

= adxd−1 + plus petites puissances de x.

De plus, puisque f(α) ≡ 0 (mod p), on a que f(x) et (x− α)f(α) ont les mêmes coefficientsmod p. En particulier,

f(x) ≡ (x− α)f(x) (mod p) pour tout x ∈ Z,

d’où on trouve que les racines de f mod p sont aussi de racines de f mod p. Alors, soitRf (p) =

Rf (p), soit Rf (p) = Rf (p)\α (mod p) (on est dans le deuxième cas s-si f(α) 6≡ 0 (mod p)).Dans tous les cas, l’hypothèse inductive implique qu’il existe m′1 ≥ 0, m2, . . . ,mr ≥ 1, et unpolynôme g(x) ∈ Z[x] de degré d− 1−m′1 −

∑rj=2mj tels que

g(x) ≡ (x− α1)m′1(x− α2)

m2 · · · (x− αr)mrg(x) (x ∈ Z).

Par conséquent, si on pose m1 = m′1 + 1 ≥ 1, on trouve que

f(x) = (x− α1)m1(x− α2)

m2 · · · (x− αr)mrg(x) (x ∈ Z),

ce qui conclut l’étape inductive et, par la suite, la démonstration.

Finalement, on montre comment on peut déterminer les racines d’un polynômes mod pven commençant avec ses racines mod p. Le résultat-clé est appelé le lemme de Hensel. Dansson énoncé, f ′(x) dénote la dérivée de f(x) = adx

d + · · ·+ a1x+ a0, définie par

f ′(x) = dadxd−1 + (d− 1)ad−1x

d−2 + · · · 2a2x+ a1.

Théorème 2.30 (Hensel). Soit f(x) ∈ Z[x]. Si f(x1) ≡ 0 (mod p) et f ′(x1) 6≡ 0 (mod p),alors pour chaque v ≥ 2 il existe une classe d’équivalence xv (mod pv) unique pour laquellexv ≡ x1 (mod p) et f(xv) ≡ 0 (mod pv).

Le théorème au-dessus est un corollaire direct du lemme suivant.

Page 47: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.5. ÉQUATIONS POLYNOMIALES 47

Lemme 2.31 (Hensel). Soit p un nombre premier, v ≥ 1 et f(x) ∈ Z[x]. Supposons quef(xv) ≡ 0 (mod pv) et considérons une classe de congruence xv+1 (mod pv+1) telle que xv+1 ≡xv (mod pv), c’est-à-dire xv+1 = xv + tpv pour un t ∈ Z. Alors on a que

f(xv+1) ≡ 0 (mod pv+1) ⇔ f ′(xv) · t ≡ −f(xv)/pv (mod p).

En particulier, si f ′(xv) 6≡ 0 (mod p), alors il existe un unique t (mod p) qui satisfait cettecongruence et, par la suite, une unique classe de congruence xv+1 (mod pv+1) telle que xv+1 ≡xv (mod pv) et f ′(xv+1) ≡ 0 (mod pv+1).

Démonstration. Si xv+1 = xv + tpv, alors on a que

xmv+1 = (xv + tpv)m = xmv +

(m

1

)xm−1v tpv +

(m

2

)xm−2v (tpv)2 + · · ·

≡ xmv +mxm−1v tpv (mod pv+1),

puisque 2v ≥ v + 1 pour v ≥ 1. Donc

f(xv + tpv) =d∑

m=0

am(xv + tpv)m ≡d∑

m=0

am(xmv +mxm−1v tpv) (mod pv+1)

≡ f(xv) + tpvf ′(xv) (mod pv+1).

On a que pv|f(xv) par hypothèse. Par la suite

f(xv + tpv) ≡ 0 (mod pv+1) ⇔ tpvf ′(xv) ≡ −f(xv) (mod pv+1)

⇔ tf ′(xv) ≡ −f(xv)/pv (mod p),

comme affirmé. Finalement, si f ′(xv) 6≡ 0 (mod p), alors l’inverse de f ′(xv) existe modulo p,ce qui implique que t ≡ −(f ′(xv))

−1f(xv)/pv (mod p). Ceci conclut la démonstration.

Démonstration du théorème 2.30. D’après le lemme 2.31 et induction sur v, on trouve qu’ilexiste une suite x2, x3, x4, . . . telle que xv (mod pv) est l’unique classe d’équivalence mod pvpour laquelle xv ≡ xv−1 (mod pv−1) et f(xv) ≡ 0 (mod pv). Alors le résultat désiré suit toutde suite.

Exemple 2.32. Résolvons l’équation quadratique

x2 − 4x+ 8 ≡ 0 (mod 25).

Solution. Soit f(x) = x2 − 4x+ 8. Tout d’abord, on résoudre l’équation modulo 5. Á fin defaire cela, on compléter le carré :

f(x) = (x− 2)2 − 22 + 8 = (x− 2)2 + 4 ≡ (x− 2)2 − 12 (mod 5) ≡ (x− 3)(x− 1) ≡ (mod 5).

Alorsf(x) ≡ 0 (mod 5) ⇔ x ≡ 3 (mod 5) ou x ≡ 1 (mod 5).

Page 48: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

48 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

Puis, on observe que f ′(x) = 2x−4 et donc f ′(1) = −2 6≡ 0 (mod 5) et f ′(3) = 2 6≡ 0 (mod 5).Alors le lemme d’Hensel implique qu’il existe exactement une racine de f modulo 25, soita (mod 25), telle que a ≡ 1 (mod 5) et f(a) ≡ 0 (mod 25). De plus, si on pose a = 1+5t, alors

f ′(1) · t ≡ −f(1)/5 (mod 5) ⇔ 2t ≡ 1 (mod 5) ⇔ t ≡ 3 (mod 5).

Donc a ≡ 16 (mod 25). De même, il existe exactement une racine de f modulo 25, soit b,telle que b ≡ 3 (mod 5) et f(b) ≡ 0 (mod 25). On pose b = 3 + 5s pour que

f ′(3)s ≡ −f(3)/5 (mod 5) ⇔ 2s ≡ −1 (mod 5) ⇔ s ≡ 2 (mod 5).

Donc b ≡ 13 (mod 25).Par conséquent, les solutions à l’équation f(x) ≡ 0 (mod 25) sont x ≡ 13 (mod 25) et

x ≡ 16 (mod 25).

Exercices

Exercice 2.1. Soit n ∈ N et a, b ∈ Z. Montrez que a2 ≡ b2 (mod n) si et seulement si ilexiste deux nombres naturels k et ` tels que n = k`, a ≡ b (mod k) et a ≡ −b (mod `).

Exercice 2.2. (a) Montrez que si n est impair, alors n2 ≡ 1 (mod 8).(b) Est-ce qu’il y a de solutions à l’équation pα + 1 = 2β, où p est premier et α, β ≥ 2 ?

[Indice : Montrez que α doit être impair et factorisez pα + 1.]

Exercice 2.3. Montrez que pour tout entier positif n, le nombre 1n + 2n + 3n + 4n + 5n + 6n

est divisible par 7 si et seulement si n n’est pas un multiple de 6.

Exercice 2.4. Trouvez un critères de divisibilité d’un nombre par 11, 13 et 37, si le nombreest donné dans la base décimale.

Exercice 2.5. Trouvez un critères de divisibilité d’un nombre par 10, si le nombre est donnédans la base binaire.

Exercice 2.6. Dans la base hexadécimale les chiffres sont 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A = 10, B =11, C = 12, D = 13, E = 14, F = 15. Par exemple,

(10AB4)16 = 4+B ·16+A ·162+0 ·163+1 ·164 = 4+11 ·16+10 ·256+0+65536 = (68276)10.

Déterminez si le nombre (5A3BF204BC376F4A)16 est divisible par 5 (sans faire la conver-sion à la base de 10).

Exercice 2.7. Résolvez les suivants systèmes de congruences :

(a)

x ≡ 4 (mod 7)

3x ≡ 2 (mod 11)

7x ≡ 1 (mod 13)

(b)

x ≡ 2 (mod 28)

3x ≡ 8 (mod 10)(c)

2x ≡ 4 (mod 10)

3x ≡ 8 (mod 7)

Page 49: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

2.5. ÉQUATIONS POLYNOMIALES 49

Exercice 2.8. Montrez que pour tous m,n ∈ N, on a

φ(mn) = φ(m)φ(n)(m,n)

φ((m,n)).

Exercice 2.9. Montrez que si n > 2, alors φ(n) est un nombre pair.

Exercice 2.10. Soit p un nombre premier.(a) Montrez que xp ≡ x (mod p) pour tous x ∈ Z.(b) Montrez que xpk ≡ x (mod p) pour tous x ∈ Z et tous k ∈ Z≥1.(c) Montrez que si f(x) ∈ Z[x], alors il existe deux polynômes q(x), g(x) ∈ Z[x] tels que :

(a) f(x) = q(x)(xp− x) + g(x) ; (b) deg(g) < p. [Indice : utilisez induction sur le degréde f(x).]

(d) Si f(x) et g(x) sont comme ci-dessus, alors montrez que Rf (p) = Rg(p).(e) Si f(x) ∈ Z[x] a degré d ≥ 1, alors on sait que f ′(x) est un polynôme sur Z de degré

d − 1. Cependant, ceci n’est pas toujours vrai sur Z/pZ : par exemple, le polynômexp − x a comme dérivée pxp−1 − 1 qui est égale à −1 mod p. Montrez, quand même,que si d < p, alors deg(f ′) = d− 1.

Exercice 2.11. Soient p un premier, f(x) ∈ Z[x] et x0 ∈ Z.(a) Montrez qu’il existe quelques nombres aj ∈ Z uniques tels que f(x) =

∑dj=0 aj(x−x0)j,

où d = deg(f). [Indice : Considérez le polynôme f(x− x0).](b) Montrez que f(x0) ≡ 0 (mod p) si et seulement si a0 ≡ 0 (mod p).(c) Montrez que f(x0) ≡ 0 (mod p) et f ′(x0) ≡ 0 (mod p) si et seulement si a0 ≡ a1 ≡

0 (mod p).

Exercice 2.12. Trouvez toutes les solutions aux équations polynomials suivantes :(a) x2 ≡ 2 (mod 49)

(b) x3 + x+ 1 ≡ 0 (mod 27)

(c) x2 − 2x+ 3 ≡ 0 (mod 16)

(d) x2 − x+ 10 ≡ 0 (mod 50)

Exercice 2.13. Dans le lemme de Hensel, on étudie des racines x0 de l’équation f(x) ≡0 (mod pν) avec p - f ′(x0). Décrivez un algorithme pour déterminer les racines de l’équationf(x) ≡ 0 (mod pν) dans le cas où p|f ′(x0). Appliquez votre algorithme pour résoudre l’équa-tion x2 ≡ a (mod pν), où a, p et ν sont donnés. Déterminez quand il existe de solutions etcalculez leur nombres.

Page 50: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

50 CHAPITRE 2. ARITHMÉTIQUE MODULAIRE

Page 51: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 3

Éléments de la théorie des groupes

Dans ce chapitre, on présente quelques définitions et résultats venant de la théorie desgroupes qui vont nous permettre d’apprécier l’arithmétique modulaire d’un point de vue plusabstrait, ainsi que de faciliter quelques démonstrations.

3.1 Le concept d’un groupeSoit un ensemble G muni d’une opération ∗. Souvent, l’opération ∗ est la multiplication

· ou l’addition +. Par exemple, on pourrait avoir :Ex. 1 : l’ensemble Z muni de l’opération + ;Ex. 2 : l’ensemble Z≥0 muni de l’opération + ;Ex. 3 : l’ensemble Z>0 = 1, 2, . . . muni de l’opération · ;Ex. 4 : l’ensemble Z<0 muni de l’opération · ;Ex. 5 : l’ensemble Q>0 muni de l’opération · ;Ex. 6 : l’ensemble R≥0 muni de l’opération a ∗ b := |a− b|.Pour l’économie de la discussion, on utilise toujours le symbole ∗ dénotant une opérationabstraite (qui pourrait être la multiplication ou l’addition familière). Le pair (G, ∗) est appeléun groupe s’il satisfait quatre propriétés :

— (loi de composition interne) Si g, h ∈ G, alors g ∗ h ∈ G, i.e. le résultat de la multipli-cation de deux éléments de G est toujours un nouveau élément de G. Ceci veut direque l’exemple 3 ci-dessus n’est pas un groupe : on a, par exemple, −1 · (−1) = 1 /∈ Z<0.

— (associativité) Pour tous g, h, j ∈ G, on a que (g ∗ h) ∗ j = g ∗ (h ∗ j), c’est-à-direl’ordre dans laquelle on execute les opérations n’est pas importante. Ceci veut dire quel’exemple 6 ci-dessus n’est pas un groupe car 2 ∗ (1 ∗ 1) = 2 ∗ 0 = 2, mais (2 ∗ 1) ∗ 1 =1 ∗ 1 = 0.

— (élément neutre) il existe un élément neutre dénoté par e ayant la propriété que e∗g = get g ∗ e = g pour tout g ∈ G. Si l’opération de G est dénoté par ·, alors on dénotel’élément neutre de G par 1 ; si l’opération est dénotée par +, alors on le dénote par 0.L’élément neutre est unique s’il existe : si u ∈ G est un autre neutre élément, alors

e ∗ u = e et u ∗ e = u par la neutralité de e et de u par la gauche et par la droite,respectivement.

51

Page 52: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

52 CHAPITRE 3. ÉLÉMENTS DE LA THÉORIE DES GROUPES

L’élément neutre dans les exemples 1, 2 et 6 est le nombre 0 ; l’élément neutre dansles exemples 3 et 5 est le nombre 1 ; il n’y a pas d’élément neutre dans l’exemple 3.

— (élément inverse/opposé) pour tout g ∈ G, il existe un élément inverse, c’est-à-dire unh ∈ G tel que g ∗ h = e = h ∗ g. On peut montrer qu’il est unique et on le symbolisepar g−1. Une exception est quand l’opération de G est l’addition, dans quel cas onappelle h l’élément opposé de g et on le symbolise par −g ; il satisfait les relationsg + h = 0 = h+ g.Afin de voir l’unicité de h, supposons que j est un autre inverse de g. On considère

l’élément x := (j∗g)∗h et on le calcule de deux façons. D’un côté, on a que x = e∗h = het, d’autre côté, x = j ∗ (g ∗ h) = j ∗ e = j. On en déduit que j = h.L’axiom de l’existence d’inverses implique que l’exemple 2 ci-dessus n’est pas un

groupe car l’opposé additif d’un nombre positif est negatif. Donc, l’opposé de m > 0n’appartient pas à Z≥0. De façon similaire, dans l’exemple 3, l’inverse du nombre 2n’existe pas dans l’ensemble Z>0.

C’est facile de vérifier que les seuls groupes entre les exemples 1-6 se donnent par lespairs (Z,+) et (Q>0, ·). Des autres exemples des groupes sont : (R,+), (R \ 0, ·), (Q,+),les matrices réels 2 × 2 munis de l’addition de matrices, . . . Cependant, pour le but de celivre, les exemples les plus importants sont :

(Z/nZ,+) et ((Z/nZ)∗, ·).

C’est facile de vérifier qu’ils satisfassent les quatre axioms ci-dessus - on le laisse aux lecteurscomme un exercice.

Tous les exemples des groupes qu’on a donné satisfassent un cinquième axiom :

— (commutativité) Pour tous g, h ∈ G, on a que g ∗ h = h ∗ g.Si le paire (G, ∗) satisfait cet axiom additionnel, on dit qu’il forme un groupe abélien ou

commutatif. L’étude de ces groupes est assez plus simple. Il y a des exemples des groupesqui ne sont pas abéliens. Un tel exemple est le groupe des matrices 2 qui sont inversibles :l’ensemble

GL2(R) :=

(a bc d

): ad− bc 6= 0

,

muni de la multiplication de matrices. On a que(1 10 1

)·(

0 10 1

)6=(

0 10 1

)·(

1 10 1

).

3.2 Sous-groupesUn concept important est d’un sous-groupe d’un groupe (G, ∗). On dit que H est un

sous-groupe de G et on écrit H < G si e ∈ H et (H, ∗) est aussi un groupe, c’est-à-dire si :(a) e ∈ H ; (b) xy ∈ H chaque fois que x, y ∈ H ; (c) x−1 ∈ H chaque fois que x ∈ H.

Une caractérisation simple d’être sous-groupe suit :

Lemme 3.1. Soit (G, ∗) et H ⊂ G. On a que H < G si et seulement si :

Page 53: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

3.3. GÉNÉRATION DE GROUPES 53

— H 6= ∅ ;— pout tous a, b ∈ H, on a que a ∗ b−1 ∈ H.

Démonstration. Si H < G, alors la conclusion du lemme est claire : on a que e ∈ H, doncH 6= ∅. De plus, si a, b ∈ H, alors b−1 ∈ H (existence d’élément inverse) et donc a ∗ b−1 ∈ H(loi de composition interne).

Réciproquement, supposons que H satisfait la conclusion du lemme. Soit h ∈ H (il existeau moins un tel élément par l’hypothèse que H 6= ∅). Donc e = h ∗ h−1 ∈ H. De plus,h−1 = e ∗ h−1 ∈ H (existence d’élément inverse). Finalement, si h′ est un autre élémentde H, on va montrer que h′ ∗ h ∈ H. Tout d’abord, on note que (h−1)−1 = h. En effet,h−1 ∗ h = e = h ∗ h−1, donc h satisfait les conditions pour être l’inverse de h−1 (donc il estson inverse unique). Vu que h′, h−1 ∈ H, on trouve que h′ ∗ (h−1)−1 ∈ H et, par la suite,h′ ∗ h ∈ H, comme affirmé. Ceci montre que (H, ∗) est un groupe (l’associativité découleautomatiquement du fait que H est un sous-ensemble de G).

En utilisant le lemme 3.1, les lecteurs peuvent vérifier facilement que :

(a) L’ensemble 2Z des entiers pairs est un sous-groupe de (Z,+) ;(b) L’ensemble Z est un sous-groupe de (R,+) ;(c) L’ensemble −1, 1 est un sous-groupe de (Q, ·) ;(d) L’ensemble x (modn) : d|n est un sous-groupe de (Z/nZ,+) ;

(e) l’ensemble des matrices diagonales non-nuls(a 00 a

), a 6= 0, est un sous-groupe de

(GL2(R), ·).

3.3 Génération de groupes

Soit (G, ∗) et X ⊂ G. Peut-être X n’est pas un sous-groupe de G et se demande quelle estla façon la plus ‘économique’ de le rendre un. Il faut ajouter quelques éléments à X et arriverà un sur-ensemble de X qui est un sous-groupe de G. On dénote cet ensemble hypothétiquepar 〈X〉. Par exemple, s’il existe x ∈ X tel que x−1 /∈ X, alors il faut que x−1 est ajoutéà 〈X〉. De façon similaire, s’il existe x, y ∈ X tels que xy /∈ X, il faut ajouter xy à 〈X〉.Continuant comme cela jusqu’à l’infini, on peut construire 〈X〉. Cependant, ceci n’est pasune démonstration. De façon rigoureuse, on définite

〈X〉 :=⋂H<GH⊃X

H.

L’exercice 3.7 montre que, en effet, le côté droit est un sous-groupe de G comme l’intersectionde quelques sous-groupes de G. Évidemment, il est le plus petit sous-groupe de G contenantX.

On montre maintenant que la définition formelle qu’on a donné est d’accord avec ladéfinition plus intuitive dont on a parlé avant :

Page 54: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

54 CHAPITRE 3. ÉLÉMENTS DE LA THÉORIE DES GROUPES

Théorème 3.2. Soit (G, ∗) un groupe et X ⊂ G. On a que

〈X〉 = xε11 ∗ · · · ∗ xεkk : x1, . . . , xk ∈ X, ε1, . . . , εk ∈ −1,+1, k ∈ Z≥0,

avec la convention qu’un produit vide est égal à e. (Par exemple, 〈∅〉 = e.)

Démonstration. Soit

X = xε11 ∗ · · · ∗ xεkk : x1, . . . , xk ∈ X, ε1, . . . , εk ∈ −1,+1, k ∈ Z≥0.

Il est assez évident que 〈X〉 ⊂ X. En effet, soit x = xε11 ∗ · · · ∗ xεkk dans X, où x1, . . . , xk ∈ X

et ε1, . . . , εk ∈ −1,+1. Si H est un sous-groupe de G contentant X, alors H contientx1, . . . , xk. Mais H est un groupe, donc il contient xε11 , . . . , x

εkk pour n’importe quel choix de

ε1, . . . , εk ∈ −1,+1. Par la suite, H doit contenir leur produit, c’est-à-dire x. Ceci montreque X ⊂ H, pour chaque H < G avec H ⊂ X. Par la définition de 〈X〉, on déduit queX ⊂ 〈X〉.

Finalement, on montre que 〈X〉 ⊂ X. Vu que X contient X (en prenant k = 1 et ε1 = 1à la définition de X), et vu que 〈X〉 est le plus petit sous-groupe de G contenant X, ilsuffit de montrer que X est un sous-groupe de G. Pour le faire, on observe que e ∈ X (parconvention : on a supposé que le produit vide est égal à e). De plus, si x = xε11 ∗ · · · ∗ x

εkk

et y = yδ11 · · · yδ`` , où x1, . . . , xk, y1, . . . , y` ∈ X et ε1, . . . , εk, δ1, . . . , δ` ∈ −1,+1, alors on a

quex ∗ y−1 = xε11 ∗ · · · ∗ x

εkk ∗ y

−δ`` ∗ · · · ∗ y−δ11 ,

ce qui est évidement un nouvel élément de X. En appliquant le lemme 3.1, on voit que Xest un sous-groupe de X. Ceci termine la démonstration.

Un cas important du théorème 3.2 est donné par le sous-groupe de G engendré par unseul élément g : on a que

〈g〉 = gk : k ∈ Z,

où g0 := e, gk := g ∗ · · · ∗ g︸ ︷︷ ︸k fois

pour k ∈ Z>0, et gk := g−1 ∗ · · · ∗ g−1︸ ︷︷ ︸k fois

pour k ∈ Z<0. On peut

vérifier quegk+` = gk ∗ g`

en examinant des cas différents (selon le signe de k et de `). Donc l’ensemble gk : k ∈ Zest un sous-groupe de G contenant g, et il est certainement le plus petit sous-groupe de Gayant cette propriété. Donc 〈g〉 = gk : k ∈ Z, comme affirmé.

Dans le cas où l’opération du groupe est dénotée par +, on a que

〈g〉 = k · g : k ∈ Z,

où 0 · g := 0, k · g := g + · · ·+ g︸ ︷︷ ︸k fois

pour k ∈ Z>0, et k · g := (−g) + · · ·+ (−g)︸ ︷︷ ︸k fois

pour k ∈ Z<0.

Par exemple, si G = Z et l’opération est l’addition des entiers, alors

〈2〉 = 2Z,

Page 55: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

3.4. L’ORDRE D’UN ÉLÉMENT 55

l’ensemble des entiers pairs.

Si le groupe G est abélien et X est fini, l’énoncé du théorème 3.2 est simplifiée : on a que

〈g1, . . . , gm〉 = gk11 ∗ · · · ∗ gkmm : k1, . . . , km ∈ Z.

On dit que le groupe G est engendré par les éléments gi, i ∈ I, si G = 〈gi : i ∈ I〉.Les éléments gi sont appelés les générateurs de G. En général, les générateurs ne sont pasdéfinis uniquement. Si G est engendré par un seul élément, c’est-à-dire il existe g ∈ Gtel que G = 〈g〉, alors on dit que G est cyclique. Par exemple, le groupe (Z,+) est cyclique,engendré par l’élément 1 (ainsi que par l’élément -1). De façon similaire, le groupe (Z/nZ,+)est cyclique, engendré par l’élément 1. En général, chaque résidu réduit a (modn) est ungénérateur du groupe additif Z/nZ. Les groupes multiplicatifs (Z/nZ)∗ sont beaucoup pluscompliqués, comme on va le voir. On va les étudier au prochain chapitre. On remarque, parexemple, que (Z/6Z)∗ = 〈−1〉, que (Z/7Z)∗ = 〈3〉, et que (Z/15Z)∗ = 〈7, 11〉.

3.4 L’ordre d’un élémentSoit (G, ∗) un groupe et g ∈ G. On considère 〈g〉, le sous-groupe de G engendré par g.

On définit l’ordre de g comme suite : soit l’ensemble K = k ∈ N : gk = e. Alors, l’ordre deg est définie par

ord(g) :=

+∞ si K = ∅,minK sinon.

Si G est fini, l’ensemble K est toujours non-vide, donc k est un nombre naturel fini. Eneffet, si n = |G|, les puissances g0, g1, . . . , gn ne peuvent être toutes distinctes. Soit gi = gj

pour 0 ≤ i < j ≤ n. En multipliant à gauche par g−i, on trouve que gj−i = e, donc j− i ∈ K.Dans le cas où K 6= ∅, on a que

〈g〉 = e, g, g2, . . . , gk−1.(3.1)

En effet, c’est clair que le côté droit est un sous-ensemble du côté gauche. Vice-versa, sim ∈ Z, alors m = qk + r pour quelques q ∈ Z et r ∈ 0, 1, . . . , k − 1. Donc gm = gqk+r =(gk)q ∗ gr = gr, ce qui montre (3.1). Cet argument nous amène au lemme suivant :

Lemme 3.3. Soit (G, ∗) un groupe et g ∈ G d’ordre k <∞. On a que gm = e si et seulementsi k|m.

Démonstration. C’est clair que si k|m, alors gm = e (puisque gk = e et m = qk). Vice versa,si gm = 1 et on écrit m = qk + r, alors e = gm = gr. Mais k = minj ∈ N : gj = e et0 ≤ r < k, d’où on trouve que r = 0. Ceci conclut la démonstration.

En utilisant ce lemme, on montre un théorème très utile :

Théorème 3.4. Soit (G, ∗) un groupe abélien fini. Si n = |G|, alors l’ordre de chaqueélément de G est un diviseur de G. En particulier, gn = e pour tout g ∈ G.

Page 56: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

56 CHAPITRE 3. ÉLÉMENTS DE LA THÉORIE DES GROUPES

Démonstration. Soit g ∈ G. Considérons l’application f : G→ G, définie par f(h) := g ∗ h.Elle est une bijection : f(h) = f(h′) veut dire que gh = gh′. En multipliant à gauche parg−1, on trouve que h = h′, ce qui montre l’injectivité de f . Puisque G est fini, alors f estbijective. Par la suite, les éléments g ∗ h, h ∈ G, sont une permutation des éléments de G,ce qui implique que ∏

h∈G

(g ∗ h) =∏h∈G

h,

c’est-à-diregn ∗

∏h∈G

h =∏h∈G

h.

En multipliant à droit par l’inverse de∏

h∈G h, on trouve que gn = e. Donc ord(g)|n d’aprèsle lemme 3.3.

En appliquant le théorème precedent au groupe G = (Z/nZ)∗ des résidus réduits mod n,on arrive au théorème d’Euler, dont un cas particulier est le petit théorème de Fermat :

Corollaire 3.5. (a) (théorème d’Euler) Si (a, n) = 1, alors aφ(n) ≡ 1 (modn).(b) (petit théorème de Fermat) Si p est premier et a est un entier non-divisible par p, alors

ap−1 ≡ 1 (mod p).

Soit (G, ∗) un groupe abélien. Si k = ord(g) et ` = ord(h), alors c’est clair que (gh)[k,`] = e,donc ord(gh)|[k, `]. On peut montrer une relation plus précise dans un cas particulier :

Lemme 3.6. Soit (G, ∗) un groupe.(a) Supposons que G est abélien. Si k = ord(g) et ` = ord(h) sont finis et copremiers,

alors ord(gh) = k`.(b) k = ord(g) <∞ et d|k, alors ord(gd) = k/d.

Démonstration. (a) Soit m = ord(gh). Comme on l’a déjà discuté, on a que m|[k, `] = k`.Vice versa, on observe que (gh)m = e. Donc (gh)mk = e et, puisque gk = e, alors hmk = e.En appliquant le lemme 3.3, on trouve que `|mk et, en utilisant la coprimalité de k et de `,on trouve que `|m. De façon similaire, en échangeant les rôles de g et de h, on trouve aussique k|m. En utilisant la coprimalité de k et de ` une dernière fois, on conclut que k`|m. Ceciconclut la démonstration.

(b) Evidemment, on a que (gd)k/d = e. De plus, k/d est le plus petit nombre ayant cettepropriété par la minimalité de k. Donc k/d = ord(gd), comme affirmé.

3.5 L’exposant d’un groupe abélienLe théorème 3.4 nous dit que si (G, ∗) est un groupe abélien d’ordre n, alors gn = e.

Est-ce que n est le plus petit nombre ayant cette propriété ? En général, la réponse est non :par exemple, si G = (Z/8Z)∗, alors x2 ≡ 1 (mod 8) pour chaque x impair. On définit alorsl’exposant de G par

exp(G) := mink ≥ 1 : gk = e ∀g ∈ G, .

Page 57: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

3.5. L’EXPOSANT D’UN GROUPE ABÉLIEN 57

Dans le cas spécial où G = (Z/nZ)∗, on écrit

λ(n) := exp((Z/nZ)∗).

La fonction λ est appelée la fonction de Carmichael.On a le résultat suivant qui donne une définition alternative pour exp(G) :

Théorème 3.7. Si (G, ∗) est un groupe abélien fini, alors

exp(G) = maxord(g) : g ∈ G.

En particulier, exp(G) divise |G|.

Démonstration. Soit r = exp(G) et k = maxord(g) : g ∈ G. Puisque G est fini, il existeg0 ∈ G tel que k = ord(g0). D’après la définition de r, on a que gr0 = 1 et le lemme 3.3implique que k|r. Il reste de montrer que k ≥ r. Pour le montrer, il suffit de prouver quegk = e pour chaque g ∈ G ou, de façon équivalente, que ord(g)|k pour chaque g ∈ G.Supposons, au contraire, qu’il existe g1 ∈ G tel que ord(g1) - k. Donc, si on pose ` = ord(g1),on trouve qu’il existe un nombre premier p pour lequel vp(`) > vp(k). On écrit ` = pw`1 etk = pvk1, où w = vp(`) > vp(k) = v. En particulier, p - `1k1. On construira un élément de Gd’ordre pwk1 > k, ce qui est une contradiction à notre hypothèse que g0 a ordre maximale k.Pour le faire, on utilise le lemme 3.6 : la partie (b) de ce lemme implique que l’élément g`11a ordre pw, et que l’élément gp

v

0 a ordre k1. Donc la partie (a) du lemme 3.6 implique quel’élément g`11 g

pv

0 a ordre pwk1 > k. Ceci est impossible par le choix du k. On en déduit que`|k, comme on le voulait. Ceci termine la démonstration.

Proposition 3.8. Si (m,n) = 1, alors λ(mn) = [λ(m), λ(n)].

Démonstration. Soit k = λ(m) et ` = λ(n). Si (x,mn) = 1, alors (x,m) = (x, n) = 1 et donc

xk ≡ 1 (modm) et x` ≡ 1 (modn),

de la définition de λ. Puisque [k, `] est un multiple de k et de `, on trouve que x[k,`] ≡1 (modm) et que x[k,`] ≡ 1 (modn). Donc, x[k,`] ≡ 1 (modmn), d’après le lemme 2.17. Puisquecette relation est vraie pour n’importe quel x ∈ (Z/mnZ)∗, on déduit que [k, `] ≥ λ(mn).

Afin de montrer l’inégalité inverse, on considère a ∈ (Z/mZ)∗ et b ∈ (Z/nZ)∗ d’ordremaximale, soit k et `, respectivement. En particulier, la Proposition 3.7 implique que k =λ(m) et que ` = λ(n). On applique le théorème de restes chinois pour trouver un x (modmn)tel que x ≡ a (modm) et x ≡ b (modn). On affirme que ordmn(x) = [k, `]. En effet, on a que

xr ≡ 1 (modmn) ⇔

xr ≡ 1 (modm)

xr ≡ 1 (modn)⇔

ar ≡ 1 (modm)

br ≡ 1 (modn)

k = ordm(a)|r` = ordn(b)|r

⇔ [k, `]|r.

Ceci implique que l’ordre de x dans (Z/mnZ)∗ est égale à [k, `], comme affirmé. Par consé-quent, la proposition 3.7 implique que λ(mn) ≥ [k, `], ce qui conclut la preuve.

Page 58: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

58 CHAPITRE 3. ÉLÉMENTS DE LA THÉORIE DES GROUPES

Corollaire 3.9. Si n = pv11 · · · pvrr est la factorisation du nombre n à ses facteurs premiers,alors

λ(n) = [λ(pv11 ), . . . , λ(pvrr )].

Démonstration. Par induction sur r.

On calculera λ(pv) pour chaque nombre premier p et chaque v ≥ 1 au prochaine chapitre.

3.6 Groupes isomorphesDeux groupes (G, ∗) et (G′, ∗) peuvent être secrètement le même groupe. Par exemple,

on considère les groupes (−1, 1, ·) et (Z/2Z,+). On affirme que ces deux groupes sontpratiquement ‘égaux’. En effet, les tables de ce deux groupes sont :

· 1 -11 1 -1-1 -1 1

+ 0 10 0 11 1 0

Les tables sont identiques : le rôle de 1 au premier table est joué par 0 au deuxième table(ces sont les éléments neutres), et le rôle de -1 au premier table est joué par 1 au deuxièmetable. On dit donc que les groupes −1, 1 et Z/2Z sont isomorphes.

De façon plus générale, on dit que les groupes (G, ∗) et (G′, ∗) (les opérations peuventêtre différentes même si on utilise le même symbole) sont isomorphes s’il existe une bijectionf : G→ G′ telle que

f(a ∗ b) = f(a) ∗ f(b)

pour tous a, b ∈ G. Dans ce cas, on écrit G ∼= G′. La fonction f est appelée un isomorphisme.La relation d’isomorphisme des groupes est une relation d’équivalence. Les groupes ap-

partenant à la même classe d’équivalence sont ‘égaux’ du point de vue de la théorie desgroupes (les seules choses qui sont différentes sont les noms/symbols qu’on attribue à leurséléments et à leur opération).

Exemple 3.10. Si (G, ∗) et (G′, ∗) sont deux groupes, alors l’ensemble G × G′ = (g, g′) :g ∈ G, g′ ∈ G′ est un groupe par rapport à l’opération (g, g′) ∗ (h, h′) := (g ∗ h, g′ ∗ h′).L’élément neutre est le pair (e, e′), où e l’élément neutre de G et e′ de G′. L’inverse de (g, g′)est donné par (g−1, (g′)−1).

Si (m,n) = 1, alors on affirme que

Z/mnZ ∼= Z/mZ× Z/nZ,(3.2)

où l’opération est l’addition. De plus, on affirme que

(Z/mnZ)∗ ∼= (Z/mZ)∗ × (Z/nZ)∗.(3.3)

Ces relations sont une conséquence du théorème des restes chinois. On montre la pre-mière et laisse la deuxième comme exercice. On définit f : Z/mnZ → Z/mZ × Z/nZ parf(x (modmn)) := (x (modm), x (modn)). Comme dans la démonstration du théorème 2.24,on a que f est une bijection. De plus, c’est facile de vérifier que f(x+ y) = f(x) + f(y), d’oùla relation (3.2) suit.

Page 59: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

3.7. LE GROUPE QUOTIENT 59

3.7 Le groupe quotient

Soit (G, ∗) un groupe et soit H < G. À partir de H, on peut définir une relationd’équivalence sur G : on dit que deux éléments g1, g2 de G sont équivalents, et on écritg1 ≡ g1 (modH), si g1 ∗ g−12 ∈ H. C’est facile de vérifier que c’est un relation d’équivalence 1.

On peut vérifier facilement que la classe d’équivalence de g et l’ensemble H ∗ g := h∗ g :h ∈ H. En effet, si g′ ≡ g (modH), alors g′ ∗ g−1 ∈ H, c’est-à-dire il existe h ∈ H tel queg′ ∗ g−1 = h. En multipliant à gauche par g, on trouve que g′ = h ∗ g ∈ H ∗ g. On montre demême que si g′ = h ∗ g pour un h ∈ H, alors g ≡ g′ (modH). Ceci montre notre affirmationque la classe d’équivalence de g est l’ensemble H ∗ g.

Quand G est commutative, alors H ∗g = g ∗H = g ∗h : h ∈ H. De plus, l’ensemble desclasses d’équivalence H ∗ g, g ∈ G, dénoté par G/H, devient un groupe. Pour cette raisonon l’appelle le groupe quotient de G sur H. Son opération est définie par (H ∗ g1) ∗ (Hg2) :=H ∗ (g1 ∗ g2). Elle est bien définie (i.e. elle ne dépende pas du choix des représentants g1 etg2) : si g1 ≡ g3 (modH) et g2 ≡ g4 (modH), alors g3 = h1 ∗ g1 et g4 = h2 ∗ g2 pour quelquesh1, h2 ∈ H. Par la suite, g3 ∗ g4 = h1 ∗ g1 ∗h2 ∗ g2 = h1 ∗h2 ∗ g1 ∗ g2 ≡ g1 ∗ g2 (modH), puisqueh1∗h2 ∈ H, où on a utilisé la commutativité de G. Puisque les classes d’équivalences de deuxéléments équivalents sont identiques, on trouve que H ∗ (g1 ∗ g2) = H ∗ (g3 ∗ g4). C’est facilemaintenant de vérifier que l’opération définie ci-dessus rende G/H un groupe : les axiomssont des conséquences directes des axioms de G. L’élément neutre est la classe d’équivalenceH ∗ e = H.

Remarque 3.11. C’est clair que si G est fini, toutes les classes d’équivalences H ∗ gcontiennent le même nombre d’éléments, qui est égal à |H|. Puisque il y a |G/H| classesd’équivalences, on trouve que |H| divise |G| et, plus précisément, que

|G| = |H| · |G/H|.

En prenant H = 〈g〉, ceci offre une autre démonstration du théorème 3.4 (en fait, cet argu-ment n’a pas besoin de la commutativité de G).

Exemple 3.12. Si on considère le groupe (Z,+) et son sous-groupe nZ = m ∈ Z : n|m,alors on le groupe quotient Z/nZ est le groupe des résidus mod n qu’on a vu au dernierchapitre. Donc, on voit que le groupe quotient généralise le concept de l’arithmétique modu-laire.

Remarque 3.13. Le groupe multiplicatif (Z/nZ)∗ n’est pas un groupe quotient. C’est pos-sible de le réaliser d’un point de vu général comme le groupe des éléments inversibles del’anneau Z/nZ (veuillez ignorer ce remarque si vous n’avez pas suive le cours de l’algèbre 2).

Exemple 3.14. Si G = (Z/nZ)∗ est le groupe multiplicatif mod n, alors H = a2 (modn) :(a, n) = 1 est un sous-groupe de G. Le quotient G/H sera le sujet de la section 4.2.

1. Réflexivité : g ≡ g (modH) car g∗g−1 = e ∈ H ; symétrie : si g1 ≡ g2 (modH), alors g1∗g−12 ∈ H et doncson inverse (g1 ∗g−12 )−1 = g2 ∗g−11 ∈ H (justifiez pourquoi l’inverse de g1 ∗g−12 est égal à g2 ∗g−11 ). On trouvealors que g2 ≡ g1 (modH). Transitivité : si g1 ≡ g2 (modH) et g2 ≡ g3 (modH), alors g1 ∗ g−12 , g2 ∗ g−13 ∈ Het, par la suite, g1 ∗ g−12 ∗ g2 ∗ g

−13 = g1 ∗ g−13 ∈ H, ce qui implique que g1 ≡ g3 (modH).

Page 60: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

60 CHAPITRE 3. ÉLÉMENTS DE LA THÉORIE DES GROUPES

Supposons, maintenant, que on a deux groupes (G, ∗) et (G′, ∗). Une fonction f : G→ G′

est appelée un morphisme de groupes si elle respecte les lois des deux groupes, c’est-à-dire si

f(g1 ∗ g2) = f(g1) ∗ f(g2) pour tous g1, g2 ∈ G.

Si f est un morphisme bijectif, on l’appelle un isomorphisme. En particulier, les groupes Get G′ sont isomorphes si et seulement il existe un isomorphisme f : G → G′. Le noyau de fest l’ensemble

ker(f) := g ∈ G : f(g) = e′,où e′ dénote l’élément neutre de G.

Par exemple, la fonction f : Z→ Z définie par f(x) = nx est un morphisme de groupes.Son noyau est trivial, c’est-à-dire ker(f) = 0. (Comme on va le voir tout de suite, l’élémentneutre de G appartient toujours à ker(f).)

Lemme 3.15. Si f : G→ G′ est un morphisme de groupes, alors ker(f) < G.

Démonstration. On montre d’abord que ker(f) 6= ∅ en montrant qu’il contient e. Puisquee ∗ e = e, on trouve que f(e) = f(e ∗ e). Mais f(e ∗ e) = f(e) ∗ f(e), d’où f(e) = f(e) ∗ f(e).En multipliant par f(e)−1, on trouve que f(e) = e′.

Soit, maintenant, g ∈ ker(f). Alors e′ = f(e) = f(g ∗ g−1) = f(g) ∗ f(g−1). Puisquef(g) = e, on en déduit que f(g−1) = e et donc g−1 ∈ ker(f).

Finalement, si g1, g2 ∈ ker(f), alors f(g1) = f(g−12 ) = e. Donc

f(g1 ∗ g−12 ) = f(g1) ∗ f(g−12 ) = e′ ∗ e′ = e′.

On trouve alors que g1 ∗ g−12 ∈ ker(f). D’après le lemme 3.1, ceci montre que ker(f) est unsous-groupe de G.

Un théorème très important à l’étude des groupes est le premier théorème d’isomorphismede groupes qu’on montre au cas special de groupes abéliens. On a besoin de définir le conceptd’un épimorphisme, qui est simplement un morphisme de groupes f : G→ G′ qui est surjectif(i.e. son image est égale à G′).

Lemme 3.16. Si f : G→ G′ est un épimorphisme de groupes et G est abélien, alors

G/ ker(f) ∼= G′.

Démonstration. On pose H = ker(f) et on définit la fonction φ : G/H → G′ par

φ(H ∗ g) := f(g).

Cette fonction est bien définie : si g1 ≡ g2 (modH), alors g1 ∗ g−12 ∈ H = ker(f), c’est-à-diref(g1 ∗ g−12 ) = e′. En multipliant par f(g2), on trouve alors que

f(g2) = f(g1 ∗ g−12 ) ∗ f(g2) = f(g1 ∗ g−12 ∗ g2) = f(g1).

Donc la définition de φ ne dépende pas du choix du représentant de la classe d’équivalencegH.

C’est clair que φ est surjectif, car f l’est. De façon similaire, φ est un morphisme degroupes car f l’est. Donc, φ est un isomorphisme de groupes, ce qui montre le théorème.

Page 61: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

3.7. LE GROUPE QUOTIENT 61

Exemple 3.17. Si G = 〈g〉 est un groupe cyclique et n = ord(g) ∈ N ∪ +∞, alors ondéfinit f : Z→ G par f(m) := gm. C’est un épimorphisme de groupes. On a que

f(m) = e ⇔ gm = e ⇔ n|m ⇔

m = 0 si n = +∞,m ∈ nZ si 1 ≤ n <∞.

Donc le théorème 3.16 implique que

G ∼=

Z si n = +∞,Z/nZ si 1 ≤ n <∞.

Alors on voit que, modulo isomorphisme, les seuls groupes cycliques sont les groupes Z etZ/nZ.

Exercices

Exercice 3.1. Pour quels entiers positifs n l’expression 3n + 1 est-elle un multiple de 10 ?

Exercice 3.2. Soient a ∈ N et p un nombre premier.(a) Si (a, p) = 1, montrez que soit a

p−12 ≡ 1 (mod p) soit a

p−12 ≡ −1 (mod p).

(b) Montrez que n5

5+ n3

3+ 7n

15est un nombre entier pour chaque n ∈ N.

Exercice 3.3. Montrez que ∑d|n

φ(d) = n

pour chaque n ∈ N. [Indice : observez que n =∑

d|n #1 ≤ x ≤ n : (x, n) = d.]

Exercice 3.4. Le petit théorème de Fermat implique que xp ≡ x (mod p), pour chaquex ∈ Z. Cet exercice donne une nouvelle démonstration de ce fait.(a) Montrez que p|

(pk

), pour chaque k ∈ 1, . . . , p− 1.

(b) Montrez que (a+ b)p ≡ a+ b (mod p), pour chaque a, b ∈ Z.(c) Montrez que la fonction f(x) = xp − x est constante mod p. Déduisez que xp ≡

x (mod p), pour chaque x ∈ Z.

Exercice 3.5. Montrez que x48 ≡ 1 (mod 224), pour tout x ∈ Z qui est copremier à 14.

Exercice 3.6. Montrez que si n = pq, où p et q sont deux nombres premiers distincts, alors

aφ(n)/2 ≡ 1 (modn),

pour tout a ∈ Z qui est copremier à n.

Exercice 3.7. Soit (G, ∗) un groupe, et soit (Gi)i∈I une collection non-vide de sous-groupesde G. Montrez que ∩i∈IGi est un sous-groupe de G.

Page 62: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

62 CHAPITRE 3. ÉLÉMENTS DE LA THÉORIE DES GROUPES

Exercice 3.8. Soit A = (Z/pZ)[x], l’ensemble de polynômes ayant coefficients dans Z/pZ.Si f(x) =

∑mj=0 ajx

j et g(x) =∑n

j=0 bjxj sont deux éléments de A, alors on définit f(x) +

g(x) :=∑maxm,n

j=0 (aj + bj)xj, où on l’a posé aj = 0 si j > m et bj = 0 si j > n, et l’addition

aj + bj est faite mod p.(a) Montrez que (A,+) est un groupe abelien.(b) Montrez que (f(x)+g(x))p = f(x)+g(x) pour tous f(x), g(x) ∈ A. [Indice : Consultez

l’exercice 3.4.](c) Montrez que l’application φ : A → A, définie par φ(f(x)) = f(x)p est un morphisme

injectif de groupes. (Il est appelé le morphisme de Frobenius.)

Exercice 3.9. Soit (G,+) un groupe abelien. Étant donné n ∈ N et g ∈ G, définissonsn ·g := g + · · ·+ g︸ ︷︷ ︸

n fois

. Si n = 0, alors on pose 0 ·g = 0, et si n ∈ Z<0, on pose n ·g := (−n) ·(−g).

(a) Montrez que (m + n) · g = m · g + n · g, ainsi que (mn) · g = m · (n · g), pour tousm,n ∈ Z et g ∈ G.

(b) Montrez que m · (g + h) = m · g +m · h, pour tous m ∈ Z et g, h ∈ G.(c) Soit g ∈ G. Montrez que l’application φg : Z → G, définie par φg(n) := n · g est un

morphisme de groupes. Si φg n’est pas injectif, alors prouvez qu’il existe un nombrepremier p = p(g) tel que ker(φg) = pZ.

(d) Soit n ∈ N et définissons Gn = g ∈ G : n · g = 0. Montrez que Gn est un sous-groupede G.

(e) Supposez que G est également muni d’une opération multiplicative ∗ qui est commuta-tive et compatible avec +, c’est-à-dire g ∗ (h+ j) = g ∗h+g ∗ j. Supposez, de plus, qu’ilexiste un nombre premier p tel que p · g = 0 pour tous g ∈ G. (Un tel G est l’ensembleA de l’exercice précedent.) Montrez que l’application G 3 g → gp ∈ G (où gp veut direg ∗ · · · ∗ g︸ ︷︷ ︸

p fois

, comme habituellement) est un morphisme de groupes.

Page 63: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 4

Le groupe (Z/nZ)∗

4.1 Racines primitives

Le but de cette section est de déterminer la structure du groupe multiplicatif (Z/nZ)∗.D’après la relation 3.3, si n = pv11 · · · pvrr est la factorisation de n en facteurs premiers, alors

(Z/nZ)∗ ∼= (Z/pv11 Z)∗ × · · · × (Z/pvrr Z)∗.(4.1)

Donc, notre but se réduit à l’étude des groupes (Z/pvZ)∗, où p est premier. On montreraque la majorité de ces groupes sont cycliques, c’est-à-dire il existe un résidu réduit a (modn)tel que (Z/pvZ)∗ = 〈a (mod pv)〉. Un tel a est appelé une racine primitive mod pv. De façonanalogue, on peut définir la notion d’une racine primitive pour n’importe que modulus n.

Les deux théorèmes principaux qu’on montrera dans cette sections sont les suivants :

Théorème 4.1. Soit p un premier et v ∈ N. Si p > 2 ou si v ∈ 1, 2, alors

(Z/pvZ)∗ ∼= Z/(pv − pv−1)Z,

c’est-à-dire il existe de racines primitives mod pv. Finalement, si p = 2 et v ≥ 3, alors

(Z/2vZ)∗ ∼= Z/2Z× Z/2v−2Z.

Théorème 4.2. Le nombre n possède de racines primitives si et seulement si n ∈ 1, 2, 4∪pv : p > 2 premier, v ≥ 1 ∪ 2pv : p > 2 premier, v ≥ 1.

On commence en étudiant le cas de moduli premiers :

Théorème 4.3. Si p est un nombre premier, alors il existe de racines primitives mod p.

Démonstration. D’après le théorème 3.7, il suffit de montrer que λ(p) = p− 1. Si k = λ(p),on a que xk ≡ 1 (mod p), pour tout x ∈ 1, 2, . . . , p− 1. Donc le polynôme f(x) = xk − 1 a≥ p − 1 racines mod p. D’autre côte, f(x) peut avoir ≤ k = deg(f) racines mod p selon lethéorème 2.29. Donc k ≥ p− 1. Puisque on a toujours que k|φ(p) = p− 1, on en déduit quek = p− 1, ce qui conclut la démonstration.

63

Page 64: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

64 CHAPITRE 4. LE GROUPE (Z/NZ)∗

Démonstration alternative du théorème 4.3. On peut éviter l’utilisation du théorème 2.29dans la démonstration du théorème 4.3. Cet argument alternatif se base à l’identité

p−1∑a=1

ak ≡

−1 (mod p) si (p− 1)|k,0 (mod p) sinon,

(4.2)

pour chaque k ∈ Zk≥0. Avant de la montrer, on en déduit l’existence de racines primitivesmod p.

On pose k = λ(p). Nécessairement, 1 ≤ k ≤ φ(p) = p− 1. De plus, la définition de λ(p)implique que

p−1∑a=1

ak ≡p−1∑a=1

1 ≡ p− 1 ≡ −1 (mod p).

Donc la relation (4.2) implique que (p − 1)|k et, par la suite, k ≥ p − 1. Ceci montre quek = p− 1 et l’existence d’une racine primitive mod p découle du lemme ??.

Finalement, on montre (4.2). Puisque ak+p−1 ≡ ak (mod p), pour chaque a ∈ 1, . . . , p−1,une consequence du petit théorème de Fermat, il suffit de montrer (4.2) quand 0 ≤ k ≤ p−2.On pose

Sk =

p−1∑a=1

ak et δk =

1 si (p− 1)|k,0 sinon.

On montrera que Sk ≡ −δk (mod p) pour k ∈ 0, 1, . . . , p− 2 par induction sur k. Si k = 0,alors

S0 =

p−1∑a=1

1 = p− 1 ≡ −1 (mod p) ≡ −δ0 (mod p).

Puis, supposons que Sj ≡ −δj (mod p) pour chaque j ∈ 0, 1, . . . , k − 1, où 1 ≤ k ≤ p− 2.On montrera que Sk ≡ −δk ≡ 0 (mod p) également. On a que

p−1∑a=1

((a+ 1)k+1− ak+1) =

p−1∑a=1

(a+ 1)k+1−p−1∑a=1

ak+1 = −1 + pk+1 + Sk+1− Sk+1 ≡ −1 (mod p).

D’autre côté,

p−1∑a=1

((a+ 1)k+1 − ak+1) =

p−1∑a=1

k∑j=0

(k + 1

j

)aj =

k∑j=0

(k + 1

j

)Sj ≡ (k + 1)Sk − 1 (mod p),

par l’hypothèse inductive. En comparant les deux relations au-dessus, on conclut tout-de-suite que

(k + 1)Sk ≡ 0 (mod p) =⇒ Sk ≡ 0 (mod p),

puisque p - k + 1 par notre hypothèse que 1 ≤ k ≤ p− 2. Ceci conclut la démonstration duthéorème.

Page 65: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.1. RACINES PRIMITIVES 65

À partir du théorème précédent, on calcule la valuer de la fonction de Carmichael surles arguments qui sont une puissance d’un nombre premier. Il est important de noter icique le théorème 3.7 implique que le modulo n possède de racines primitives si et seulementsi λ(n) = φ(n). Donc, le théorème ci-dessus établit, entre autres, l’existence de racinesprimitives mod pv quand p est un nombre premier impair.

Théorème 4.4. Soit p un nombre premier et v ≥ 1. On a que

λ(pv) =

φ(pv) si p > 2,

φ(pv) si p = 2 et v ≤ 2,

φ(pv)/2 si p = 2 et v ≥ 3.

Démonstration. Cas 1 : p impair. L’égalité λ(pv) = φ(pv) est équivalent à l’existence deracines primitives mod pv. On distingue trois sous-cas :

Sous-cas 1a : v = 1. Le résultat désiré est le théorème 4.3.

Sous-cas 1b : v = 2. Soit g une racine primitive mod p. Si x (mod p2) tel que x ≡g (mod p) et on pose k = ordp2(x), on a que k|φ(p2) = p(p− 1) et que xk ≡ 1 (mod p2). Doncgk ≡ xk (mod p) ≡ 1 (mod p), ce qui implique que ordp(g) = p− 1|k. Puisque k|p(p− 1), lesseules possibilités sont k = p − 1 ou k = p(p − 1). On doit montrer qu’il existe x tel queordp2(x) = p(p − 1). De façon équivalente, on doit trouver x tel que x ≡ g (mod p) et quexp−1 6≡ 1 (mod p2). On considère le polynôme f(x) = xp−1 − 1. On a que f(g) ≡ 0 (mod p)et que f ′(g) = (p − 1)gp−2 6≡ 0 (mod p). Donc le lemme de Hensel implique qu’il existex0 (mod p2) unique tel que x0 ≡ g (mod p) et f(x0) ≡ 0 (mod p2). Mais il existe exactementp ≥ 2 classes d’équivalence modulo x (mod p2) telles que x ≡ g (mod p). Donc il existeexactement p − 1 ≥ 1 classes d’équivalence modulo x (mod p2) telles que x ≡ g (mod p) etf(x) 6≡ 0 (mod p2). Pour chaque telle classe d’équivalence x (mod p2), on a que ordp2(x) =p(p− 1), c’est-à-dire, x est une racine primitive mod p2.

Sous-cas 1c : v ≥ 3. Soit g une racine primitive mod p2, qui existe du sous-cas 1b. Onmontrera que g est une racine primitive mod pv, pour chaque v ≥ 3. Il suffit de montrer quegp

v−2(p−1) 6≡ 1 (mod pv), pour chaque v ≥ 3. En effet, si k = ordpv(g), on a que gk ≡ 1 (mod pv)et, par conséquent, gk ≡ 1 (mod p2). Donc on a que p(p − 1) = ordp2(g)|k. Aussi, on aque k|φ(pv) = pv−1(p − 1), du théorème d’Euler. Alors k = pj(p − 1) pour un nombrej ∈ 1, . . . , v− 1. Par conséquent, g est une racine primitive si et seulement si j = v− 1, siet seulement si gpv−2(p−1) 6≡ 1 (mod pv), comme clamé.

On montrera que gpv−2(p−1) 6≡ 1 (mod pe), pour chaque v ≥ 2, de façon inductive. Si v = 2,c’est vrai de notre hypothèse que g est une racine primitive mod p2. Supposons maintenantque le résultat tient pour un v ≥ 2. On a que gpv−2(p−1) = gφ(p

v−1) ≡ 1 (mod pv−1), du théorèmed’Euler. Donc gpv−2(p−1) = 1 + bpv−1 pour un b ∈ Z, où p - b car gpv−2(p−1) 6≡ 1 (mod pv). Par

Page 66: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

66 CHAPITRE 4. LE GROUPE (Z/NZ)∗

la suite,

gpv−1(p−1) = (1 + bpv−1)p = 1 +

(p

1

)bpv−1 +

(p

2

)(bpv−1)2 +

(p

3

)(bpv−1)3 + · · ·

≡ 1 +

(p

1

)bpv−1 +

(p

2

)(bpv−1)2 (mod pv+1)

≡ 1 + bpv +p− 1

2bp2v−1 (mod pv+1)

≡ 1 + bpv (mod pv+1),

parce que 3(v−1) ≥ v+1 et 2v−1 ≥ v+1 pour v ≥ 2. Puisque p - b, on déduit que gpv−1(p−1) 6≡1 (mod pv+1), ce qui conclut l’étape inductive et, par conséquent, la démonstration que pvpossède des racines primitives.

Cas 2 : p = 2. Si v ∈ 1, 2, c’est facile de verifier qu’il existe une racine primitive mod2v. Donc on a que λ(2v) = φ(2v) dans ces cas.

Finalement, on considère le cas où p = 2 et v ≥ 3. On peut verifier directement queλ(8) = 2 et λ(16) = 4, comme clamé. On montre les autres cas par induction. On supposeque λ(2w) = φ(2w)/2 = 2w−2 pour w ∈ 3, . . . , v, où v ≥ 4, et on prouve que λ(2v+1) = 2v−1.

D’abord, on montre que x2v−1 ≡ 1 (mod 2v+1), pour chaque x impair, ce qui implique toutde suite que λ(2v+1) ≤ 2v−1. En effet, l’hypothèse inductive implique que λ(2v−1) = 2v−3 et,par la suite, x2v−3 ≡ 1 (mod 2v−1). Donc x2v−3

= 1 + 2v−1b pour un b ∈ Z. Alors on déduitque

x2v−1

= (1 + 2v−1b)4 = 1 + 2v+1b+ 6 · 22v−2b2 + 4 · (2v−1b)3 + (2v−1b)4 ≡ 1 (mod 2v+1),

ce qui prouve notre affirmation.Finalement, on montre que λ(2v+1) ≥ 2v−1. Soit g impair tel que ord2v(g) = 2v−2. Il suffit

de prouver que ord2v+1(g) = 2v−1. En effet, soit b ∈ Z tel que g2v−3= 1 + 2v−1b, comme

ci-dessus. Nécessairement b est impair : sinon, on aurait que g2v−3 ≡ 1 (mod 2v), c’est-à-direord2v(g) ≤ 2v−3 < 2v−2. Donc

g2v−2

= (1 + 2v−1b)2 = 1 + 2vb+ 22v−2b2 ≡ 1 + 2vb (mod 2v+1) 6≡ 1 (mod 2v+1),

puisque 2 - b. Par conséquent, ord2v+1(g) = 2v−1, comme affirmé. C’implique que λ(2v+1) ≥2v−1 selon la Proposition 3.7, ce qui conclut la démonstration du théorème.

Remarque 4.5. La démonstration du théorème 4.4 dans le cas de moduli 2v avec v ≥ 3nous permet de déterminer un g explicit d’ordre maximale 2v−2 : on a que 5 a ordre 2 = 23−2

mod 8, et ordre 4 = 24−2 mod 16. Donc il a ordre 2v−2 mod 2v, pour tout v ≥ 3, d’après ladémonstration.

On est maintenant près de montrer les résultats principaux de cette section :

Preuve du théorème 4.1. Le premier cas du corollaire suit directement du théorème 4.4 etde l’exemple 3.17. Considérons maintenant le cas ou le modulus est 2v avec v ≥ 3. D’aprèsle remarque 4.5, on sait que 5 a ordre maximale égale à 2v−2 modulo 2v. On affirme que

Page 67: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.1. RACINES PRIMITIVES 67

chaque nombre impair n a une representation unique mod 2v de la forme n ≡ ±5k (mod 2v),où k ∈ 0, 1, . . . , 2v−2− 1. En effet, tous les nombres de la forme 5k sont 1 (mod 4). De plus,il existe 2v−2 puissances distinctes de 5 mod 2v, et aussi il existe 2v−2 résidus réduits mod2v qui sont 1 (mod 4). Par la suite, on trouve que si x est impair, alors x ≡ 1 (mod 4) si etseulement si x ≡ 5k (mod 2v) pour un k ∈ 0, 1, . . . , 2v−2−1. D’autre côté, si x ≡ 3 (mod 4),alors −x ≡ 1 (mod 4), donc −x ≡ 5k (mod 2v) pour un k ∈ 0, 1, . . . , 2v−2 − 1. Ceci montrenotre affirmation que chaque x impair a une representation de la forme ±5k modulo 2v.

On construit maintenant un morphisme f : Z/2v−2Z× Z/2Z×G par

f(k, `) := 5k · (−1)` (mod 2v).

Le fait 5 a ordre 2v−2 et −1 a ordre 2 implique que f est bien définie, ne dependantpas du choix de k (mod 2v) et de ` (mod 2). Cette fonction est un morphisme, comme onpeut facilement vérifier. Elle est surjective par la discussion ci-dessus. Puisque les groupesZ/2v−2Z×Z/2Z et G ont la même cardinalité, la fonction f doit être aussi injective. On voitdonc que les groupes Z/2v−2Z× Z/2Z et G sont isomorphes. Ceci conclut la démonstrationdu théorème 4.1.

Démonstration du théorème 4.2. Soient

M = 1, 2, 4 ∪ pe : p nombre premier impair ∪ 2pe : p nombre premier impair

etN = n ∈ N : il existe de racines primitives mod n.

“⇒ ” : Si n ∈M, alors λ(n) = φ(n) du corollaire 3.9 et du théorème 4.4. Donc n ∈ N .

“⇐ ” : On montrera que si n /∈M, alors n /∈ N .Si n possède deux facteurs premiers pairs distincts, soient p1 et p2, alors on peut écrit

n = pv11 pv22 m, où v1, v2 ≥ 1 et p1, p2 - m. De plus, φ(pvii ) = (pi−1)pvi−1i et pair pour i ∈ 1, 2.

Donc Proposition 3.8 implique que λ(n) = [λ(pv11 ), λ(pv22 ), λ(m)]. Puisque λ(a)|φ(a) pourchaque a ∈ N, une conséquence de la Proposition 3.7, on trouve que

λ(n) | [φ(pv11 ), φ(pv22 ), λ(m)] ≤ φ(pv11 )φ(pv22 )φ(m)

2=φ(n)

2.

Par la suite, n /∈ N .De même, on montre que si n = 2vpe, avec v ≥ 2 et e ≥ 1, alors

λ(n) = [λ(2v), λ(pe)] | [λ(2v), (p− 1)pe−1] ≤ φ(2v)(p− 1)pe−1

2=φ(n)

2,

car 2|λ(2v) et 2|p− 1 du théorème 4.4. Donc n /∈ N .Finalement, si n = 2v avec v ≥ 3, alors le théorème 4.4 implique que λ(2v) = 2v−2 < φ(2v)

et donc n /∈ N .

Page 68: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

68 CHAPITRE 4. LE GROUPE (Z/NZ)∗

4.2 Résidus quadratiques

Supposons qu’on veut trouver tous les x qui sont de solutions à l’équation quadratique

x2 + ax+ b ≡ 0 (mod p),(4.3)

où p est un nombre premier impair. Le nombre 2 est inversible mod un nombre impair, cequi nous permet de completer la carré :

x2 + ax+ b ≡ x2 + 2(2ax) + b (mod p) ≡ (x+ 2a)2 − (2a)2 + b (mod p)

≡ (x+ 2a)2 − 4d (mod p),

où d := a2 − 4b est le discriminant du polynôme x2 + ax+ b. Donc on arrive à l’équation

(x+ 2−1a)2 ≡ 4−1d (mod p) ⇔ (2x+ a)2 ≡ d (mod p).

Par la suite,

#x (mod p) : x2 + ax+ b ≡ 0 (mod p) =

0 si d 6≡ r2 (mod p) pour tout r ∈ Z,1 si d ≡ 0 (mod p),

2 si p - d et d ≡ r2 (mod p) pour un r ∈ Z.

Dans le deuxième cas, la seule solution à (4.3) est x ≡ 2a (mod p), et dans le troisième cas lesdeux solutions sont 2 · (−a± r) (mod p), où r est une racine quadratique de d modulo p. Onarrive alors au résultat analogue du théorème familier concernant la résolution x2+ax+b = 0avec x ∈ R.

Ceci nous amène à la définition suivante :

Définition 4.6. Pour chaque a ∈ Z et chaque nombre premier p, on définit le symbole deLegendre

(a|p) =

(a

p

):=

0 si p|a,1 si a ≡ x2 pour un x 6= 0 (mod p),

−1 sinon.

Si (a|p) = 1, alors on dit que a est un résidu quadratique modulo p. Si (a|p) = −1, alors ondit que a est un non-résidu quadratique modulo p.

Avec cette définition, on a que

#x (mod p) : x2 + ax+ b ≡ 0 (mod p) = 1 +

(a2 − 4b

p

).

Notre but dans cette section est de comprendre quand un nombre donné a est un résiduquadratique ou un non-résidu quadratique. On commence avec le lemme de base suivant.

Lemme 4.7. Soit p un nombre premier.

Page 69: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.2. RÉSIDUS QUADRATIQUES 69

(a) Si p > 2, alors les résidus quadratiques modulo p occupent les (p−1)/2 distinctes classesd’équivalence 12 (mod p), 22 (mod p), . . ., ((p−1)/2)2 (mod p). Par consequent, il existe(p− 1)/2 résidus quadratiques modulo p et (p− 1)/2 non-résidus quadratiques modulop.

(b) Le multiple de deux résidus quadratiques mod p est un résidu quadratique mod p ; lemultiple d’un résidu quadratique mod p et un non-résidu quadratique mod p est unnon-résidu quadratique mod p ; le multiple de deux non-résidus quadratiques mod p etun résidu quadratique mod p.

Démonstration. Soient G = (Z/pZ)∗ et H = x2 (mod p) : p - x. C’est clair que H < G.On affirme que |H| = (p − 1)/2 =: p0. En effet, on a que Z/pZ = Z ∩ [−p0, p0] d’après lecorollaire 2.6. Donc G = ±j (mod p) : 1 ≤ j ≤ p0 et H = j2 (mod p) : 1 ≤ j ≤ p0. Onaffirme que les carrés j2 sont distincts mod p quand j ∈ [1, p0]. En effet, si j2 ≡ i2 (mod p),alors p|(j2− i2) = (j− i)(j + i). Puisque 2 ≤ j + i ≤ 2p0 < p, on a que p - j + i. Par la suite,p|j − i et, puisque 1 ≤ i, j ≤ p0 < p, on trouve que i = j. Ceci montre que la partie (a) dulemme. En particulier, il montre que |H| = p0.

Maintenant, on passe à la partie (b). La seule affirmation qui n’est pas directe est que leproduit de deux résidus non-quadratiques est un résidu quadratique. Puisque |G| = |G/H| ·|H|, le groupe quotient G/H a cardinalité 2, donc G = H ∪ nH, où n /∈ H. Mais n2 ∈ Hpar définition, donc n2H = H. La classe d’équivalence nH est l’ensemble de tous les résidusnon-quadratiques. Si n1, n2 ∈ nH, alors n1H = n2H = nH, donc

n1n2H = (n1H) · (n2H) = (nH) · (nH) = n2H = H,

ce qui implique que n1n2 ∈ H. Ceci conclut la démonstration.

Lemme 4.8 (Critère d’Euler). Si p > 2 est un nombre premier et a ∈ Z, alors(a

p

)≡ a

p−12 (mod p).

Démonstration. Le lemme est trivial quand p|a, donc supposons que p - a. Soit g une racineprimitive mod p, et soit h = g(p−1)/2. On a que h2 ≡ 1 (mod p), mais que h 6≡ 1 (mod p).Donc h ≡ −1 (mod p). On écrit, maintenant, a en termes de g : on a que a ≡ gk (mod p)pour un k ∈ Z. Les résidus quadratiques sont exactement les puissances paires de g. Alors,si k = 2`+ r avec r ∈ 0, 1, on a que (a|p) = (−1)r. D’autre côté, on a que

a(p−1)/2 = (gp−1)` · hr ≡ (−1)r (mod p),

ce qui termine la démonstration.

Corollaire 4.9. Soit p un nombre premier. Pour tous a, b ∈ Z, on a que(ab

p

)=

(a

p

)(b

p

).

En particulier, la fonction n→(np

)est complètement multiplicative.

Page 70: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

70 CHAPITRE 4. LE GROUPE (Z/NZ)∗

Puisque le symbole de Legendre est une fonction complètement multiplicative, le théorème4.9 implique que si n = ±qv11 qv22 · · · qvrr ∈ Z, où q1, . . . , qr sont nombres premiers positifsdistincts, alors (

n

p

)=

(±1

p

)(q1p

)v1 (q2p

)v2· · ·(qrp

)vr.

Donc, afin de calculer (n|p), il suffit de savoir la valuer de (−1|p) et de (q|p) pour chaquenombre premier q. On calcul d’abord (−1|p) et (2|p). La valuer de (q|p), où q est un nombrepremier impair, sera discutée après.

Théorème 4.10. Si p > 2 un nombre premier, alors on a que(−1

p

)=

1 si p ≡ 1 (mod 4),

−1 si p ≡ 3 (mod 4).

Démonstration. Le résultat est un corollaire direct du critère d’Euler.

Théorème 4.11. Si p > 2 un nombre premier, alors on a que(2

p

)=

1 si p ≡ ±1 (mod 8),

−1 si p ≡ ±3 (mod 8),

Démonstration. On utilise le critère d’Euler. Soit p0 = (p− 1)/2. On observe que

∏1≤m≤p−1

2|m

m =

p0∏j=1

(2j) = 2p0p0!.(4.4)

Puis, on réécrit le produit au côté droit. Soit j0 = bp0/2c, pour que 2j ≤ p−1 si et seulementsi j ≤ j0. Les nombres pairs 2j ∈ (p0, p−1] sont en correspondence avec les nombres impairs2i− 1 ∈ [1, p0]. En effet, si 2j ∈ (p0, p− 1], alors p− 2j est un nombre impair qui appartientà [1, p0], et vice-versa. Puisque il existe p0− j0 nombres pairs dans (p0, p− 1], on trouve que∏

p0<m≤p−12|m

m ≡ (−1)p0−j0∏

p0<m≤p−12|m

(p−m) ≡∏m≤p02-m

m (mod p).

Donc ∏1≤m≤p−1

2|m

m ≡∏m≤p02|m

m∏

p0<m≤p−12|m

m (mod p)

≡ (−1)p0−j0∏m≤p02|m

m∏m≤p02-m

m (mod p)

≡ (−1)p0−j0p0! (mod p).(4.5)

En comparant les relations (4.4) et (4.5), et puisque (p0!, p) = 1, on trouve que 2p0 ≡(−1)p0−j0 (mod p). Par conséquent, le critère d’Euler nous donne que (2|p) ≡ (−1)p0−j0 (mod p).

Page 71: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.2. RÉSIDUS QUADRATIQUES 71

Puisque les nombres (2|p) et (−1)p0−j0 prennent les valeurs ±1, la dernière congruence est,en fait, une égalité. Le résultat affirmé suit d’une examination du signe de (−1)p0−j0 selon laclasse d’équivalence du p modulo 8.

Le résultat fondamental pour calculer (q|p) quand q est un premier impair est le théorèmesuivant.

Théorème 4.12 (la loi de réciprocité quadratique). Si p et q sont deux nombres premiersimpairs et districts, alors (

p

q

)(q

p

)= (−1)

p−12· q−1

2 .

Avant de montrer ce théorème, on verra comment il peut nous aider de calculer le symbolede Legendre. Comme nous l’avons vu, il suffit de calculer (a|p) quand a = −1 ou a est unnombre premier. On a déjà calculé (a|p) quand a ∈ −1, 2. Supposons, maintenant, qu’onveut calculer (3|p). Si p = 2, alors (3|p) = 1, et si p = 3, alors (3|p) = 0. Supposonsmaintenant que p > 3. La loi de réciprocité quadratique donc implique que(

3

p

)= (−1)

p−12

3−12

(p3

)= (−1)

p−12

(p3

).

On a que

(−1)p−12 =

1 si p ≡ 1 (mod 4),

−1 si p ≡ 3 (mod 4),et

(p3

)=

1 si p ≡ 1 (mod 3),

−1 si p ≡ 2 (mod 3).

On est arrivé donc au résultat suivant :

Théorème 4.13. Si p > 3 un nombre premier, alors on a que(3

p

)=

1 si p ≡ ±1 (mod 12),

−1 si p ≡ ±5 (mod 12).

Il y a plusieurs démonstrations de la loi de réciprocité quadratique. On va présenter deuxpreuves ici.

La première est grâce à Gauss. On peut voir l’idée principale plus facilement qu’en autresdémonstrations, mais on paie le prix d’avoir un argument plus long. L’étape-clé de la dé-monstration est le lemme suivant. L’argument s’appuie sur une généralisation de la preuvedu théorème 4.11. Rappelez que dans cette dernière preuve, on a montré que (2|p) = (−1)n,où n = #j ∈ N : (p− 1)/2 < 2j ≤ p− 1. On généralise maintenant ce résultat.

Lemme 4.14. Soient p > 2 un nombre premier et a ∈ Z tels que (a, p) = 1. Dénotonspar Np(a) le nombre des entiers j ∈ [1, (p − 1)/2] pour lesquels aj (mod p) appartient àx (mod p) : (p− 1)/2 < x ≤ p− 1.(a) (lemme de Gauss) On a que (

a

p

)= (−1)Np(a).

Page 72: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

72 CHAPITRE 4. LE GROUPE (Z/NZ)∗

(b) Si a est impair, alors on a que

Np(a) ≡

p−12∑j=1

⌊aj

p

⌋(mod 2).

Démonstration. (a) Soit p0 = (p − 1)/2. Pour chaque j ∈ 1, . . . , p0, on considère rj ∈Z∩ (−p0, p0] tel que aj ≡ rj (mod p). On observe que rj < 0 si et seulement si le reste de ajquand on le divise par p se trouve dans (p0, p− 1]. Donc

Np(a) = #1 ≤ j ≤ p0 : rj < 0.

On affirme que les nombres |r1|, |r2|, . . . , |rp0 | sont distincts modulo p. En effet, si |ri| ≡|rj| (mod p) pour quelques i, j ∈ 1, . . . , p0, alors ri ≡ εrj (mod p) pour un ε ∈ −1, 1. Doncai ≡ εaj (mod p). Puisque (a, p) = 1, on trouve que i ≡ εj (mod p), c’est-à-dire p|(i − εj).Cependant, |i− εj| ≤ i+ j ≤ 2p0 = p− 1, ce qui implique i− εj = 0. Puisque 1 ≤ i, j ≤ p0et ε ∈ −1, 1, il faut que ε = 1 et i = j. Ceci montre notre affirmation que les nombres|r1|, |r2|, . . . , |rp0| sont distincts modulo p. Mais ces sont p0 nombres qui appartiennent tousà 1, 2, . . . , p0. Par conséquent,

|r1|, . . . , |rp0| = 1, . . . , p0.(4.6)

Alors, on trouve que

p0! =

p0∏j=1

|rj| = (−1)Np(a)p0∏j=1

rj ≡ (−1)Np(a)p0∏j=1

(aj) (mod p)

≡ (−1)Np(a)ap−12

p0∏j=1

j (mod p)

≡ (−1)Np(a)(a

p

)p0! (mod p),

d’après le critère d’Euler. Puisque (p0!, p) = 1, on trouve que (a|p) ≡ (−1)Np(a) (mod p).Puisque les nombres (a|p) et (−1)Np(a) prennent les valeurs ±1, la dernière congruence est,en fait, une égalité. Ceci conclut la démonstration de la première partie du lemme.

(b) Soit sj le reste de aj quand divisé par p. On observe que

sj =

rj si 0 ≤ rj ≤ p0,

p+ rj si − p0 < rj < 0.

Doncp0∑j=1

sj =

p0∑j=1

rj +Np(a)p ≡ Np(a) +

p0∑j=1

rj (mod 2),

parce que p est impair. De plus, on observe que x ≡ |x| (mod 2), pour tout x ∈ Z. Doncp0∑j=1

rj ≡p0∑j=1

|rj| ≡p0∑j=1

j (mod 2)

Page 73: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.2. RÉSIDUS QUADRATIQUES 73

où on a utilisé la relation (4.6). Par conséquent,

Np(a) ≡p0∑j=1

sj −p0∑j=1

j (mod 2).

Finalement, puisque aj = kp + sj, pour un k ∈ Z et 0 ≤ sj < p, on a que baj/pc =bk + sj/pc = k. Donc sj = aj − p baj/pc, ce qui implique que

p0∑j=1

sj = a

p0∑j=1

j −p0∑j=1

⌊aj

p

⌋≡

p0∑j=1

j +

p0∑j=1

⌊aj

p

⌋(mod 2),

d’après notre hypothèse que a est impair. Ceci conclut la démonstration du lemme.

Démonstration du théorème 4.12. On pose p0 = (p − 1)/2 et q0 = (q − 1)/2. On examinerales sommes

p0∑j=1

⌊qj

p

⌋et

q0∑k=1

⌊pk

q

⌋.

On observe quep0∑j=1

⌊qj

p

⌋=

p0∑j=1

∑1≤k≤qj/p

1 = #(j, k) ∈ N2 : j ≤ p0, k ≤ qj/p

= #(j, k) ∈ N2 : j ≤ p0, k ≤ q0, pk ≤ qj.

De même,q0∑k=1

⌊pk

q

⌋=

q0∑k=1

∑1≤j≤pk/q

1 = #(j, k) ∈ N2 : k ≤ q0, j ≤ pk/q

= #(j, k) ∈ N2 : j ≤ p0, k ≤ q0, pk ≥ qj.

Puisque il n’y a pas de pair (j, k) ∈ N2 avec 1 ≤ j ≤ p0, 1 ≤ k ≤ q0 et pk = qj (sinon, ontrouve que p|j et donc j ≥ p, une contradiction), alors

p0∑j=1

⌊qj

p

⌋+

q0∑k=1

⌊pk

q

⌋= #(j, k) ∈ N2 : j ≤ p0, k ≤ q0 = p0q0.

En combinant cette relation avec le lemme 4.14, on en déduit queNp(q)+Nq(p) ≡ p0q0 (mod 2)et que (

p

q

)(q

p

)= (−1)p0q0 ,

ce qui est ce qu’il fallait montrer.

Démonstration alternative du théorème 4.12. On présente une preuve différente de la loi deréciprocité quadratique grâce à George Rousseau (On the quadratic reciprocity law. J. Aus-tral. Math. Soc. Ser. A 51 (1991), no. 3, 423–425), présentée aussi ici https://mathoverflow.net/questions/1420/whats-the-best-proof-of-quadratic-reciprocity.

Page 74: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

74 CHAPITRE 4. LE GROUPE (Z/NZ)∗

On considère le groupe G = (Z/pZ)∗ × (Z/qZ)∗, et trois ensembles A,B,C ⊂ G quicontient un moitié de G, i.e. pour tout g ∈ G, ils contient soit g ou −g. En identifiant Gavec (Z/pqZ)∗ (ils sont de groupes isomorphes), on choisit

A = i (mod p) : 1 ≤ i ≤ (p− 1)/2 × Z/qZ∗,

B = (Z/pZ)∗ × j (mod q) : 1 ≤ j ≤ (q − 1)/2,C = k (mod qp) : 1 ≤ k < pq/2, (k, pq) = 1.

Par construction, les produits∏

a∈A a,∏

b∈B b et∏

c∈C c différent par quelques signes.Si p0 = (p− 1)/2 et q0 = (q − 1)/2, alors∏

a∈A

a =∏

1≤i≤p0

∏1≤j≤q−1

(i, j) =∏

1≤i≤p0

(iq−1, (q − 1)!) = (p0!q−1, (q − 1)!p0)

et, de même, ∏b∈B

b = ((p− 1)!q−1, q0!p−1).

Finalement, on a que

4.3 CaractèresLe corollaire 4.9 implique que le symbole de Legendre définit un morphisme du groupe

(Z/pZ)∗ au groupe multiplicatif C∗ := C \ 0. En général, un morphisme

χ : (Z/qZ)∗ → C∗

est appelé un caractère de Dirichlet mod q. Le nombre q est parfois appelé le modulus ducaractère. On peut prolonger χ sur Z en mettant

χ(n) :=

χ(n (mod q)) si (n, q) = 1,

0 sinon.

C’est facile de vérifier que χ est une fonction q-périodique et complètement multiplicativedans le sens que

χ(mn) = χ(m)χ(n) ∀m,n ∈ Z.Les deux points de vue sont équivalents. Donc, parfois, on va parler de caractères de Dirichletcomme étant de fonctions définies sur Z.

Le concept des caractères de Dirichlet se généralise sur n’import quel groupe. Ici on seconcentre au cas des groupes abéliens finis qui est plus simple. Soit un (G, ∗) un telgroupe. Un morphisme χ : G → C∗ est appelée un caractère de G. L’ensemble de tous lescaractères de G est dénoté par G.

Remarque 4.15. Si n = |G| et χ est un caractère de G, alors χ(g) est une n-ième racinede l’unité. En effet, comme on l’a vu à la démonstration du lemme 3.15, on a que χ(e) = 1.De plus, le théorème 3.4 implique que gn = e. Donc, 1 = χ(gn) = χ(g)n, ce qui montre notreaffirmation.

Page 75: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.3. CARACTÈRES 75

Exemple 4.16. Soit le groupe additif G = Z/qZ. C’est un groupe cyclique engendré par1 (mod q). De plus, χ(n (mod q)) = χ(1 (mod q))n car χ est un morphisme. Alors la valuerde χ(1 (mod q)), soit ζ, détermine le caractère χ. Selon le remarque 4.15, ζ est une q-ièmeracine de l’unité, c’est-à-dire ζ = e2πia/q pour un a ∈ 0, 1, . . . , q.

Vice versa, si ζ = e2πia/q est une q-ième racine de l’unité, on peut définir le caractèreχ(n (mod q)) := e2πian/q. C’est bien défini, ne dépendant pas du choix de représentant de laclasse d’équivalence n (mod q).

On voit donc que G est en correspondence avec les q-ièmes racines de l’unité. En parti-culier, |G| = q.

Remarque 4.17. On peut munir l’ensemble G d’une opération de multiplication commesuivant. Si χ, ψ : G → C∗ sont deux caractères, alors c’est immédiat que leur produitχψ : G→ C∗, défini simplement par (χψ)(g) := χ(g) · ψ(g), est aussi un caractère de G. Lepair (G, ·) est un groupe abélien. L’inverse de χ est simplement sont réciproque : χ−1(g) :=1/χ(g). On note que, puisque χ(g) est une racine de l’unité, alors 1/χ(g) = χ(g), son conjuguécomme nombre complexe. L’élément neutre de G est le caractère trivial 1 : G → C∗, définipar 1(g) = 1. Il est appelé le caractère principal de G.

Théorème 4.18. Si (G, ∗) est un groupe abélien fini, alors |G| = |G|.

Démonstration. Ce résultat se base sur un théorème profond de la théorie des groupe qu’ondonne sans démonstration : il existe nombres q1, . . . , qk tels que

G ∼= Z/q1Z× · · · × Z/qkZ.

En mots, tous les groupes abéliens finis sont de produits de groupes cycliques ! Il suffit alorsde monter le résultat quand G = Z/q1Z× · · · × Z/qkZ. Dans ce cas, |G| = q1 · · · qk.

Pour chaque j ∈ 1, . . . , k, on définit χj : Z/qjZ → C∗ en posant χj(nj (mod qj))d’être la valuer de χ quand evalué au vecteur dont tous les cordonnés valent 0, sauf lej-ième cordonné qui vaut nj (mod qj). C’est facile de vérifier que χj est un caractère dugroupe Z/qjZ. En particulier, selon l’exemple 4.16, il existe aj ∈ 0, 1, . . . , qj − 1 tel queχj(nj (mod qj)) = e2πiajnj/qj . On trouve alors que

χ(n1 (mod q1), . . . , nk (mod qk)) =k∏j=1

χj(nj (mod qj)) = e2πi(a1n1/q1+···+aknk/qk).(4.7)

Vice versa, une fonction définie par (4.7) est un caractère de G. On a montré alors que|G| = q1 · · · qk = |G|, comme affirmé.

L’importance des caractères se trouve, entre autres, à leur orthogonalité. Plus précisément,soit

L2(G) := α : G→ C,

l’espace des fonctions complexes définies sur G. Evidemment, c’est un espace linéaire sur Cet G ⊂ L2(G). Sa dimension sur C est égale à |G| (chaque fonction α : G → C est définie

Page 76: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

76 CHAPITRE 4. LE GROUPE (Z/NZ)∗

par |G| valeurs ; les fonctions εh : G→ C, définies pour chaque h ∈ G par εg(g) := 1g=h sontune base de L2(G)). De plus, on peut munir L2(G) d’un produit interne défini par

〈α, β〉G :=1

|G|∑g∈G

α(g)β(g).

Le théorème 4.19 plus bas montre que G est un ensemble orthonormal de L2(G). En particu-lier, c’est un ensemble linéairement indépendant. Puisque |G| = |G| = dimC(L2(G)), alors Gest une base orthonormale de L2(G), c’est-à-dire chaque fonction f : G→ C peut s’écrirecomme

f =∑χ∈G

〈f, χ〉G · χ.(4.8)

On définit f : G→ C, la transformation de Fourier de f , par

f(χ) := 〈f, χ〉G.

Alors la formule (4.8) devient

f =∑χ∈G

f(χ)χ,(4.9)

le développement de Fourier de f . 1

Théorème 4.19. Si χ, ψ ∈ G, alors

〈χ, ψ〉G = 1χ=ψ.

Démonstration. Soit le caractère ξ = χψ, pour que 〈χ, ψ〉G = |G|−1∑

g∈G ξ(g). Si χ = ψ,alors ξ = 1 et le théorème suit directement. Si χ 6= ψ, alors il existe h ∈ G avec ξ(h) 6= 1.Puisque G ∗ h = G, on trouve que∑

g∈G

ξ(g) =∑g∈G

ξ(g ∗ h) =∑g∈G

ξ(g)ξ(h) = ξ(h)∑g∈G

ξ(g).

Mais ξ(h) 6= 1, donc∑

g∈G ξ(g) = 0. Ceci conclut la démonstration.

Exemple 4.20. Si G = (Z/pZ)∗, χ(a) = (a|p) est le symbole de Legendre, et ψ(a) = 1 estle caractère principale, alors le théorème 4.19 implique que

p−1∑a=1

(a

p

)= 0.

Ceci est une autre démonstration du fait qu’il existe aussi beaucoup résidus quadratiquesque non-résidus quadratiques.

1. Comparez cette formule avec le développement en séries de Fourier d’une ‘bonne’ fonction 1-périodiquef : R → C, donnée par f(x) =

∑n∈Z ane

2πinx avec an =∫ 1

0f(x)e−2πinxdx. Le groupe ici est le tore

G = R/Z (car on travaille avec des fonctions 1-périodiques), et son groupe de caractères est infini car Gl’est : ils sont les fonctions x→ e2πinx avec n ∈ Z. Finalement, le produit interne ici est donné par l’intégrale〈α, β〉G :=

∫ 1

0α(x)β(x)dx.

Page 77: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.3. CARACTÈRES 77

Remarque 4.21. En appliquant la formule (4.9) avec la fonction f(g) = 1g=e, pour laquellef(χ) = χ(e)/|G| = 1/|G|, on trouve que

1g=e =1

|G|∑g∈G

χ(g).(4.10)

En remplacant g par g ∗ h−1, où h est un autre élément de G, on trouve que

1g=h =1

|G|∑g∈G

χ(g)χ(h).(4.11)

Si G = (Z/qZ)∗, (a, q) = 1 et n ∈ Z, alors cette relation devient

1n≡a (mod q) =1

φ(q)

∑χ (mod q)

χ(n)χ(a),

où χ (mod q) veut dire que χ est un caractère de Dirichlet de modulus q vu comme unefonction χ : Z → C. Cette relation joue un rôle très important dans l’étude de nombrespremiers en progressions arithmétiques.

Remarque 4.22. On a la formule de Parseval∑χ∈G

|f(χ)|2 =1

|G|∑g∈G

|f(g)|2.(4.12)

En effet, puisque |z|2 = z · z, alors on trouve que∑χ∈G

|f(χ)|2 =1

|G|2∑χ∈G

∑g∈G

f(g)χ(g)∑h∈G

f(h)χ(h) =1

|G|2∑g∈G

f(g)f(h)∑χ∈G

χ(g)χ(h),

et (4.12) découle de (4.11).

Exercices

Exercice 4.1. Trouvez toutes les solutions aux équations suivantes :(a) x2 − 3x+ 3 ≡ 0 (mod 343).(b) x2 + 7x− 9 ≡ 0 (mod 63).(c) x12 + 2x11− 3x+ 9 ≡ 0 (mod 121). [Indice : Divisez le polynôme par x11− x (cf. petit

théorème de Fermat).](d) x3 − 30x2 + 5x− 2 ≡ 0 (mod 169).(e) x2 − 5x− 4 ≡ 0 (mod 169).

Exercice 4.2. Soient p un nombre premier et d un diviseur de p − 1. Montrez que lepolynôme xd − 1 a exactement d racines modulo p. [Indice : Montrez que xp−1 − 1 = (xd −1)f(x) pour un polynôme f de degré p− 1− d et utilisez le théorème 2.29.]

Page 78: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

78 CHAPITRE 4. LE GROUPE (Z/NZ)∗

Exercice 4.3. Soient p un nombre premier,

Kp = #a ∈ 0, 1, . . . , p− 1 : a3 ≡ 1 (mod p)

etLp = #(x, y) ∈ 0, 1, . . . , p− 12 : x3 ≡ y3 (mod p).

(a) Trouvez une formule générale pour Kp.(b) Montrez que Lp = 1 + (p− 1)Kp.

Exercice 4.4. Cette exercice donne un troisième argument pour l’existence de racines pri-mitives modulo p. Posons ψ(d) = 1 ≤ a ≤ p− 1 : ordp(a) = d.(a) Montrez que

∑d|n ψ(d) = n, pour chaque n|(p− 1). [Indice : exercice 4.2.]

(b) Montrez que ψ(d) = φ(d), pour chaque d|(p−1), par induction sur d. [Indice : théorème3.3]

(c) Déduisez l’existence de racines primitives modulo p et le théorème ?? dans le cas où nest premier.

Exercice 4.5. Soit p un nombre premier et v ≥ 1. Montrez que si g est une racine primitivemodulo pv+1, alors il est une racine primitive modulo pv.

Exercice 4.6. (a) Trouvez un nombre g qui est une racine primitive mod 5v, pour chaquev ≥ 1. Faites la même chose modulo 7v et modulo 11v.

(b) Trouvez g tel que ord2v(g) = λ(2v) = 2v−2, pour chaque v ≥ 3.

Exercice 4.7. Soit p > 3 un nombre premier. Calculer (3|p) en utilisant l’idée en arrièrede la démonstration du théorème 4.11. [Indice : Considérer le produit P =

∏j≤p0(3j), où

p0 = (p− 1)/2. ]

Exercice 4.8 (∗). Soit p > 2 un nombre premier.

(a) Si a ∈ Z est non divisible par p, alors montrez que

p∑x=1

(x2 + ax

p

)= −1.

(b) Si(dp

)= −1, alors montrez que

p−1∑x=1

(x2 − 1

p

)+

p−1∑x=1

(dx2 − 1

p

)= 2

p−1∑a=1

(a− 1

p

)= −2

(−1

p

).

Déduisez quep∑

x=1

(x2 − dp

)= −1.

Page 79: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

4.3. CARACTÈRES 79

(c) Pour tout a, b ∈ Z, montrez que

p∑x=1

(x2 + ax+ b

p

)=

−1 si p - a2 − 4b,

p− 1 si p|a2 − 4b.

Exercice 4.9. Résolvez l’équation x2 − 20x+ 139 ≡ 0 (mod 1583).

Page 80: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

80 CHAPITRE 4. LE GROUPE (Z/NZ)∗

Page 81: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 5

Équations diophantiennes

Dans ce chapitre, on étudie des équations diophantiennes : ces sont d’équations algé-briques, données par polynômes, pour lesquelles on cherche de solutions entiers ou rationnels 1

Des exemples sont :

— on cherche de trouver les solutions entières de l’équation linéaire ax+ by = c ;— on cherche de trouver de triples pythagoriciens, c’est-à-dire de nombres naturels x, y, z

tels que x2 + y2 = z2 (on peut construire un triangle rectangle pour chaque tel triplet).— on cherche de trouver les solutions entières x, y, n de l’équation x2+y2 = n ; c’est-à-dire

on cherche de déterminer quels nombres naturels n peuvent s’écrire comme la sommede deux carrés x2 + y2.

5.1 Une équation diophantienne linéaireSoient trois nombres entiers fixés, a, b et c avec a, b 6= 0. Est-ce qu’il existe x, y ∈ Z tels

que

ax+ by = c?(5.1)

Tout d’abord, on observe que si l’équation (5.1) a de solutions, nécessairement le plus grandcommun diviseur de a et b, soit d, divise c. En effet, on a que d|a et d|b et, par la suite,d|(ax + by) = c. Réciproquement, on affirme que si d = (a, b) divise c, alors (5.1) a desolutions. En effet, théorème 1.9 implique qu’il existe x0, y0 ∈ Z tels que

ax0 + by0 = d.

En multipliant cette équation par c/d, on trouve que le pair (cx0/d, cy0/d) est une solutionà (5.1). De plus, on peut calculer cette solution en utilisant l’algorithme euclidien.

À partir d’une solution donnée, on peut trouver toutes les solutions à (5.1). Soient x0et y0 comme au-dessus et soit (x1, y1) := (cx0/d, cy0/d). Observons que tous les pairs de laforme (x1 + tb/d, y1 − ta/d), t ∈ Z, sont de solutions à (5.1). Réciproquement, on montrera

1. La théorie moderne des équations diophantiennes s’occupe de l’étude d’équations algèbriques dans desensembles plus générales que les entiers et les rationnels.

81

Page 82: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

82 CHAPITRE 5. ÉQUATIONS DIOPHANTIENNES

que si (x, y) ∈ Z2 est une autre solution à (5.1), alors on peut l’écrire dans la forme (x1 +tb/d, y1 − ta/d), pour un certain t ∈ Z. En effet, on a que

ax+ by = d = ax1 + by1 =⇒ a(x− x1) = b(y − y1).

On écrit a = dk et b = d`, pour que (k, `) = 1. Donc

k(x− x1) = `(y1 − y).

Alors `|k(x−x1) et, puisque (k, `) = 1, le lemme d’Euclid implique que `|x−x1, c’est-à-direx = x1 + `t pour un t ∈ Z. Par la suite, `(y1 − y) = k`t, ce qui implique que y = y1 − `t,comme affirmé.

Pour conclure, on a montré le résultat suivant :

Théorème 5.1. Soient a, b ∈ Z \ 0 et c ∈ Z. L’équation diophantienne linéaire possèdede solutions si et seulement si d := (a, b)|c. Dans ce cas, il possède une infinité de solutions :ils sont les éléments de l’ensemble (cx0/d + tb/d, cy0/d − ta/d) : t ∈ Z, où x0 et y0 sonttels que ax0 + by0 = c.

5.2 Triplets pythagoriciensTout le monde connait le théorème de Pythagore : étant donné un triangle droit, le

carré de son hypoténuse est égal à la somme des carrés de ses deux cotés perpendiculaires.Algébriquement, si z est le longueur de l’hypoténuse et x et y sont les longueurs des deuxcotés perpendiculaires, alors

x2 + y2 = z2.(5.2)

Réciproquement, si les nombres x, y et z satisfassent l’équation (5.2), alors on peut construireun triangle droit dont les longueurs des cotés sont x, y et z. Une question naturelle est si ilexiste de triangles droits dont tous les cotés ont de longueur qui est un nombre entier. Defaçon équivalente, est ce qu’il y a de triplets (x, y, z) ∈ Z3 qui satisfassent l’équation (5.2).Un tel triplet est appelé un triplet pythagoricien. La réponse et qu’oui, il existe de tripletspythagoriciens. Par exemple, (3, 4, 5) en est un et (5, 12, 25) en est un autre. Le but de cettesection est de décrire tous les triplets pythagoriciens. L’observation-clé est que l’équation(5.2) peut s’écrire comme

y2 = z2 − x2 = (z − x)(z + x).

Donc, on déduira que, sous certains conditions, on peut factoriser y en deux facteurs dont lescarrés sont égaux à z − x et à z + x, respectivement. Afin de faire ceci, il faut faire quelquesréductions préparatoires au problèmes.

Tout d’abord, si (x, y, z) est un triplet pythagoricien, alors (mx,my,mz) en est un aussi.De même, si d est un commun diviseur diviseur de x, y et z, alors le triplet (x/d, y/d, z/d)est un triplet pythagoricien. Donc dans notre cherche pour de triplets pythagoriciens, onpeut supposer sans perte de généralité que (x, y, z) = 1. Un tel triplet est appelé primitif. Lesmembres d’un triplet pythagoricien sont deux par deux copremiers. En effet, si il existait un

Page 83: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

5.3. ÉQUATIONS DIOPHANTIENNES INSOLUBLES 83

nombre premier p qui divisait x et y, alors p diviserait aussi z2 = x2 + y2. Mais dans ce casp|z et, par la suite, p|(x, y, z) = 1, qui est impossible. Alors on déduit que (x, y) = 1, commeaffirmé. De même façon, on peut montrer que (x, z) = (y, z) = 1 aussi.

On peut faire d’autres commentaires faciles : puisque a2 ≡ 1 (mod 4) pour tout nombreimpair a, alors au moins un entre le x et le y doit être pair ; sinon, on aurait que z2 ≡2 (mod 4), ce qui est impossible. Sans perte de généralité, on suppose que 2|y ; sinon, on peutpermuter x et y et les renommer. Si 2|y, alors il faut que x et z soient impairs. Ceci impliqueque (x− z, x+ z) = 2. En effet, si d = (x− z, x+ z), alors on a que d|(x− z) + (x+ z) = 2xet que d|(x + z) − (x − z) = 2z, c’est-à-dire d|(2x, 2z) = 2(x, z) = 2. Donc soit d = 1 soitd = 2. Puisque x et z sont les deux impairs, alors 2|(x − z) et 2|(x + z) et, par la suite, ilfaut avoir que d = 2, comme affirmé. En écrivant y = 2y1, on trouve que

4y21 = y2 = z2 − x2 = (z − x)(z + x) =⇒ y21 =z − x

2· z + x

2.

Evidemment, si ab est un carré et (a, b) = 1, alors a et b sont également de carrés. Donc ilexiste u, v ∈ Z tels que z−x

2= v2 et z+x

2= u2. En particulier, (u, v) = 1, z = u2 + v2 et

x = u2 − v2. Aussi, puisque x est impair, il faut que 2|uv. Finalement, on a que y21 = (uv)2

et, par la suite, y1 = ±uv. Sans perte de généralité, on peut supposer que y1 = uv ; sinon, onpeut remplacer u par −u. Donc on conclut que un triplet pythagoricien primitif peut s’écrirecomme

(x, y, z) = (u2 − v2, 2uv, u2 + v2),(5.3)

où (u, v) = 1 et 2|uv. Réciproquement, si (x, y, z) est comme avant, donc il est clairementprimitif et, de plus,

x2 + y2 = (u2 − v2) + (2uv)2 = u4 − 2u2v2 + v4 + 4u2v2 = (u2 + v2) = z2,

c’est-à-dire (x, y, z) est un triplet pythagoricien primitif. Pour conclure, on a montré le ré-sultat suivant.

Théorème 5.2. On a que

(x, y, z) triplet pythagoricien primitif : 2|y = (u2 − v2, 2uv, u2 + v2) : 2|uv, (u, v) = 1.

5.3 Équations diophantiennes insolublesComme on l’a vu à la dernière section, l’équation x2 + y2 = z2 a plusieurs solutions.

Cependant, ce n’est pas toujours le cas que une équation diophantienne a de solutions entiers.Par exemple, l’équation

x2 = −1− y2(5.4)

n’a pas de solutions réelles, puisque le coté gauche est toujours ≥ 0 et le coté droit esttoujours ≤ −1. A fortioriEn particulier, elle n’a pas de solutions entières.

Page 84: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

84 CHAPITRE 5. ÉQUATIONS DIOPHANTIENNES

Un autre exemple de nature différente est l’équation

x2 + 3y2 = 1570.(5.5)

Cette équation a plusieurs solutions réelles qui forment une ellipse. Cependant, on affirmequ’elle n’a pas de solutions entières. En effet, pour tout a ∈ Z, on a que a2 ≡ 0, 1 (mod 4).Donc x2 + 3y2 ≡ 0, 1, 3 (mod 4) mais 1570 ≡ 2 (mod 4). On en déduit que (5.5) n’a pas desolutions entières, car chaque telle solution “globale” impliquerait une solution “locale” mod4.

La discussion ci-dessus nous donne un critère pour le non-existence de solutions à uneéquation diophantienne : une équation diophantienne qui possède de solutions entières, néces-sairement a de solutions réelles et de solutions modulo n, pour n’importe quel nombre n. Enconsidérant la proposition contraposée, si on peut refuter soit l’existence de solutions réellesou l’existence de solutions « locales »(c’est-à-dire modulo un nombre n) d’une équation, alorscette équation n’a pas de solutions entières.

Cependant, c’est possible qu’une équation diophantienne possède de solutions réelles etde solutions locales pour tout n, mais qu’elle n’a pas de solutions entières. Dans ce cas,on peut utiliser d’autres techniques pour prouver la non existence de solutions. Une telletechnique a été développée par Fermat afin d’étudier sa fameuse équation xn + yn = zn

quand n ≥ 3. La méthode de Fermat est appelée la descente infinie et son idée est simple etélégante : on commence avec une solution hypothétique à une équation et, à partir d’elle, onconstruit une nouvelle solution qui est ‘plus petite’ (dans un certain sens - habituellement,on mesure la « magnitude » d’une solution en termes de la taille de ses coefficients).

On commence avec un exemple simple pour démontrer la méthode de la descente infinie.Considérons l’équation

x3 + 3y3 = 9z3.(5.6)

On montrera qu’elle n’a pas de solutions sauf la solution triviale (0, 0, 0). Supposons aucontraire que le triplet (x0, y0, z0) ∈ Z3 est une solution. On construira un nouveau triplet(x1, y1, z1) ∈ Z3 telle que

0 < max|x1|, |y1|z1| < max|x0|, |y0|, |z0|.(5.7)

En itérant cette procedure, on peut construire une infinité de triplets distingues (x, y, z) ∈ Z3

dont tous les cordonnés sont≤ max|x0|, |y0|, |z0| en valuer absolue. C’est clairement absurd,donc l’hypothèse initiale qu’il existe une solution (x, y, z) 6= (0, 0, 0) à l’équation (5.6) estfausse.

En effet, si x30 + 3y30 = 9z30 , alors 3|x0. Si on écrit x0 = 3x1, alors 9x31 + y30 = 3z30 . Par lasuite, 3|y0. On écrit y0 = 3y1 pour que 3x31 + 9y31 = z30 . Donc 3|z0 et, si on écrit z0 = 3z1,alors on trouve que x13 + 3y31 = z31 . Ceci construit la nouvelle solution promise (x1, y1, z1) =(x0/3, y0/3, z0/3). Evidemment, elle satisfait (5.7), et la construction est complète.

Pierre de Fermat a étudié le livre de Diophantus d’Alexandre décrivant la déterminationde tous les triples pythagoriciens. qui contenait la solution de l’équation x2 + y2 = z2 avec

Page 85: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

5.3. ÉQUATIONS DIOPHANTIENNES INSOLUBLES 85

x, y, z ∈ Z. Il s’est arrivé à la question naturelle suivante : est-ce qu’il existe de solutionssi on remplaces les carrés par de puissances plus grandes ? L’équation diophantienne estdonc xn + yn = zn. On cherche de solutions entières et non-triviales, c’est-à-dire avec xyz 6=0 (les triples (t, 0, t) et (0, t, t), t ∈ Z, sont de solutions triviales). Fermat a conjecturéen 1637 qu’il n’existe pas de solutions non-triviales et il affirmé qu’il avait une “solutionmagnifique” mais que la marge du livre de Diophantus ne suffisait par pour l’écrire. Il adéfie les autres mathématiciens de trouver la preuve de son résultat, qui est devenu connucomme le dernier théorème de Fermat. Cela a pris plus que 350 ans pour battre le défi deFermat : en 1994, Andrew Wiles, avec la collaboration de Richard Taylor, a enfin publiéla démonstration du dernier théorème de Fermat. Les méthodes que Wiles a introduit sontvraiment révolutionnaires (c’est peu probable que Fermat a montré son théorème de cettefaçon - en fait, c’est un débat ouvert si Fermat possédait d’une preuve correcte), mais ilssont dehors les buts de ces notes. Ici on présent la démonstration du cas n = 4 du dernierthéorème de Fermat qui est élémentaire. En fait, on montre un résultat plus fort :

Théorème 5.3. Soient x, y, z ∈ Z. Si x4 + y4 = z2, alors xyz = 0.

Démonstration. On utilise la méthode infinie de Fermat : supposons que

A := (x, y, z) ∈ Z3 : xyz 6= 0, x4 + y4 = z2 6= ∅.

On peut choisir (x, y, z) ∈ A tels que |z| est minimal, c’est-à-dire

|z| = min|z′| : (x′, y′, z′) ∈ A.

On construira un triplet (x′, y′, z′) ∈ A tel que |z′| < |z|, ce qui est clairement une contra-diction.

Tout d’abord, puisque (−t)2 = t2, sans perte de généralité, on peut supposer que x, y, z ∈N ; sinon, on peut les remplacer par −x par −y ou par −z, respectivement. On observe que(x2, y2, z) est un triplet pythagoricien, qui est primitif. Afin de voir que il est primitif, il suffitde montrer que d := (x, y, z) est égal à 1. En effet, on a que d4|x4 +y4 = z2 et donc d2|z. Ceciimplique que (x/d, y/d, z/d2) ∈ A et, par la suite, |z/d2| ≥ |z|. Donc d = 1, comme affirmé.

Puisque (x2, y2, z) est un triplet pythagoricien primitive, alors soit 2|x2 soit 2|y2, selonla discussion de la section 5.2. Sans perte de généralité, on peut supposer que 2|y2 (sinon,on permute x et y). Par conséquent, x et z sont impairs et y est pair. Alors, le théorème 5.2implique que

x2 = u2 − v2, y2 = 2uv, z = u2 + v2,

pour quelques u, v ∈ N avec (u, v) = 1 et 2|uv. En fait, puisque x2 ≡ 1 (mod 4) pour xpair, alors on doit avoir que 2|v et que u ≡ 1 (mod 2). On écrit y = 2y1 et on observe que2y21 = uv. Donc u = a2 et v = 2b2, où (a, 2b) = 1 et ab = y1. D’autre côté, les relations(u − v, u + v) = 1 et x2 = (u − v)(u + v) impliquent que u − v = k2 et u + v = `2, pourquelques k, ` ∈ N avec (k, `) = 1, 2 - k` et k` = x. Donc u = (k2 + `2)/2 et v = (`2 − k2)/2et, par conséquent, k2 + `2 = 2a2 et `2−k2 = 4b2. On a que (`−k, `+k) = 2, d’où on déduitque `− k = 2b21 et que `+ k = 2b22, où b1b2 = b et (b1, b2) = 1. En remplaçant ces relations àl’équation k2 + `2 = 2a2, alors on trouve que

2a2 = (b21 + b22)2 + (b22 − b21) = 2(b41 + b42) =⇒ b41 + b42 = a2,

Page 86: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

86 CHAPITRE 5. ÉQUATIONS DIOPHANTIENNES

c’est-à-dire (b1, b2, a) ∈ A. Mais a < z, ce qui est une contradiction à la minimalité de z.Ceci conclut la démonstration que A = ∅.

5.4 Sommes de deux carrésQuels sont les nombres entiers qu’on peut écrire comme la somme de deux carrés ? C’est

aussi un problème diophantien un peu différent des autres qu’on a étudié aux sections pré-cédentes. Ici on demande pour quels n ∈ N il y a de solutions à l’équation x2 + y2 = n, avecx, y ∈ Z. Clairement, ce n’est pas le cas toujours : on a que 3 6= x2 + y2, pour tous x, y ∈ Z.

On laisse pour l’instant cette question, et on étudie la question semblable de quels nombrespeuvent s’écrire comme la différence de deux carrés. En notation algébrique, pour quel nexistent-ils x, y ∈ N tels que n = x2− y2. Si c’est le cas, alors n = (x− y)(x+ y), c’est-à-diren a une factorisation de la forme ab avec a = x− y et b = x + y. Cette factorisation est unpeu spéciale : on a que 2|a− b. Vice versa, si n = ab avec 2|a− b, on peut résoudre le systèmex− y = a et x+ y = b pour trouver deux solutions entières x = (a+ b)/2 et y = (b− a)/2.

Alors, on voit que n peut s’écrire comme la différence de deux carrés si et seulement si il aune factorisation n = ab avec 2|a−b. Ceci est le cas toujours si n est impair : on peut prendrea = 1 et b = n. Ceci est aussi le cas si 4|n : on peut prendre a = 2 et b = n/2 ≡ 0 (mod 2).Mais ceci n’est pas possible si 2‖n, car si n = ab, alors soit a soit b est pair, mais pas lesdeux. Donc a− b est toujours impair.

On a classifié donc les nombres n qui peuvent s’écrire comme la différence de deux carrés :ils sont les nombres n 6≡ 2 (mod 4). On voit, alors, que notre réponse a une périodicité mod 4.Retournons maintenant à la question de nombres n qui peuvent s’écrire comme la somme dedeux carrés. Est-ce que une réponse si semble est aussi possible ? Voici les premiers membresde la suite de nombres représentables comme la somme de deux carrés :

1, 2, 4, 5, 8, 9, 10, 13, 16, 17, 18, 20, 25, 26, 29, 32, 34, 36, 37, 40, 41, 45, 49, 50, 52, 53, 58, 61, 64,

65, 68, 72, 73, 74, 80, 81, 82, 85, 89, 90, 97, 98, 100, 101, 104, 106, 109, 113, 116, 117, 121, 122,

125, 128, 130, 136, 137, 144, 145, 146, 148, 149, 153, 157, 160, . . .

La structure de cette suite semble beaucoup plus compliquée. Cependant, si on se concentreà ses membres premiers, la structure devient beaucoup plus simple :

2, 5, 13, 17, 29, 37, 41, 53, 61, 73, 89, 97, 101, 109, 113, 137, 149, 157, . . .

On ose alors à conjecturer que les nombres premiers représentables comme la somme de deuxcarrés sont exactement le nombre 2 et les nombres premiers congruents à 1 (mod 4).

Une partie de notre conjecture est facile à montrer : on a que 2 = 12 + 12. De plus,si p ≡ 3 (mod 4), alors p ne peut pas s’écrire comme la somme de deux carrés. En effet,x2 ≡ 0, 1 (mod 4) pour tous x ∈ Z, donc x2 + y2 ≡ 0, 1, 2 (mod 4) pour tous x, y ∈ Z. Ontrouve, alors que p 6= x2 + y2 pour tous x, y ∈ Z.

La partie difficile de la conjecture concerne les nombres premiers p ≡ 1 (mod 4) et lapreuve qu’ils sont représentables comme la somme de deux carrés. On donne une démons-tration algébrique. Le point de départ est la solution du problème de différences de carrésci-dessus, qu’on essaie à imiter. On veut, alors, factoriser x2 + y2. Pour le faire, on passe aux

Page 87: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

5.4. SOMMES DE DEUX CARRÉS 87

nombres complexes : on a que x2 + y2 = (x + iy)(x − iy), où i est l’unité imaginaire pourlaquelle i2 = −1. Il apparait, alors, que la clé se trouve dans l’arithmétique des nombres dela forme x + iy avec x, y ∈ Z. Ces nombres s’appellent entiers gaussiens et on dénote leurensemble par

Z[i] := x+ iy |x, y ∈ Z.Avant d’étudier les entiers gaussiens, on observe que le passage au plan complexe nous

permettre de démontrer une propriété fondamentale de la suite des nombres qui sont lasomme de deux carrés :

Lemme 5.4. Si m et n sont la somme de deux carrés, alors mn l’est aussi.

Démonstration. On a que m = a2 + b2 = |a + ib|2 pour quelques a, b ∈ Z. De même,n = c2 + d2 = |c+ id|2 pour quelques c, d ∈ Z. Donc

mn = |a+ ib|2 · |c+ id|2 = |(a+ ib)(c+ id)|2 = |(ac−bd)+ i(ad+bc)|2 = (ac−bd)2+(ad+bc)2.

Le lemme ci-dessus nous montre que l’étude des premiers est la clé pour comprendrequels nombres sont la somme de deux carrés.

On revient maintenant à l’étude des entiers gaussiens. On peut imaginer que cette ex-tension des entiers réguliers a des propriétés similaires. Tout d’abord, si on ajoute ou onmultiplie deux entiers gaussiens, on obtient un nouvel élément de Z[i]. On peut alors parlerdes nombres gaussiens premiers : on dit que z = x+ iy est premier dans Z[i] s’il n’a pas unefactorisation ‘non-triviale’. Mais il faut comprendre c’est quoi une telle factorisation. Parexemple, on peut écrire de façon triviale

z = 1 · z et z = −1 · (−z).

Mais, on peut aussi écrirez = i · (−iz) et z = −i · iz

où iz = −y + ix est un autre entier gaussien. Ces sont aussi de factorisations triviales,existantes toujours.

En général, les factorisations triviales sont obtenues par des éléments u ∈ Z[i] \ 0 telsque 1/u ∈ Z[i], parce que dans ce cas on peut factoriser z dans Z[i] comme z = u · (u−1z). Si1/u ∈ Z[i], alors u 6= 0 |1/u| ≥ 1 et, par la suite, |u| ≤ 1. Les seuls entiers gaussiens u 6= 0qui satisfont cette inégalité sont les nombres ±1,±i.

Définition 5.5. On dit que l’entier gaussien z est un composé gaussien si on peut l’écrirecomme z = αβ avec α, β /∈ ±1,±i. Si z n’est pas un composé gaussien, on l’appelle uncomposé premier.

Observez que chaque nombre entier n > 1 qui est la somme de deux carrés est un composégaussien quand on le voit comme un élément de Z[i]. En effet, on a que n = x2 + y2 =(x+ iy)(x− iy) et, puisque n > 1, les facteurs x± iy ne sont pas triviaux. En particulier, 2et 5 sont de composés gaussiens.

Un réciproque partiel existe aussi :

Page 88: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

88 CHAPITRE 5. ÉQUATIONS DIOPHANTIENNES

Lemme 5.6. Si p est un premier dans Z qui est composé dans Z[i], alors p est la sommede deux carrés.

Démonstration. On a que p = (a+ ib)(c+ id) pour quelques a+ ib, c+ id /∈ ±1,±i. Donc

p2 = |(a+ ib)(c+ id)|2 = |a+ ib|2|c+ id|2 = (a2 + b2)(c2 + d2).

Puisque a + ib, c + id /∈ ±1,±i, on a que a2 + b2, c2 + d2 > 1. La primalité de p alorsimplique que p = a2 + b2 = c2 + d2.

Soit maintenant un nombre premier p ≡ 1 (mod 4). On veut montrer qu’il est la somme dedeux carrés. D’après le lemme 5.6, il suffit de montrer qu’il est composé dans Z[i]. Supposons,au contraire, que p est premier dans Z[i]. L’observation-clé pour obtenir une contradictionest que (−1|p) = 1 (voir théorème 4.10).Ceci veut dire qu’il existe un m ∈ Z tel quep|m2 + 1 = (m+ i)(m− i). Si p était premier dans Z[i], ceci voudrait sûrement dire que soitp|m+i ou p|m−i. Mais c’est une contradiction : si, par exemple, p|m+i, alorsm+i = p·(a+bi)pour quelques a, b ∈ Z. En particulier, 1 = pb, ce qui est impossible. De même, on voit quela relation p|m− i est absurde. On a montré alors le théorème suivant :

Théorème 5.7. Un nombre premier p > 2 peut s’écrire comme la somme de deux carrés siet seulement si p ≡ 1 (mod 4).

Ou, peut-être, non ? On a utilisé dans notre argument que si p est un gaussien premieret p|(m + i)(m − i), alors p|m + i ou p|m − i comme un résultat evident. Mais ce résultatassume que le théorème fondamental de l’arithmétique reste vrai dans Z[i], ce qui n’est pasévident ! En fait, le théorème fondamental de l’arithmétique peut être violé quand on passeà d’extensions de Z. Considérons, par exemple, l’ensemble

Z[√−5] := a+ b

√−5 | a, b ∈ Z.

On a que 6 = 2·3 = (1+√−5)(1−i

√5). On peut aussi montrer que les nombres 2, 3, 1±

√−5

ne se factorisent pas de façon non-trivial dans Z[√−5]. Donc on voit que la factorisation

unique est violée dans cet ensemble !

Comment peut-on montré que la factorisation unique en facteurs premiers est aussi vraiedans Z[i] ? La clé dans la démonstration du théorème fondamental de l’arithmétique (cf.théorème 1.26) est le lemme d’Euclid (cf. lemme ). Et la clé dans la démonstration dulemme d’Euclid est la division euclidienne. On pourrait alors montré l’analogue de la divisioneuclidienne dans Z[i]. On a le théorème suivant :

Théorème 5.8. Si z, w ∈ Z[i] avec w 6= 0, alors il existe q, r ∈ Z[i] tels que |r| < |w| etz = qw + r.

Démonstration. On considère le quotient z/w = x + iy pour quelques x, y ∈ Q. Il existedes entiers a, b tels que |x − a|, |y − b| ≤ 1/2. On pose q = a + ib, pour que |z/w − q|2 =|x− a|2 + |y− b|2 ≤ 1/4 + 1/4 = 1/2. Donc r := z− qw a magnitude |r| ≤ |w|/

√2 < |w|.

Page 89: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

5.4. SOMMES DE DEUX CARRÉS 89

En utilisant le théorème 5.8, on peut montrer que le pgcd de deux nombres gaussiensz, w est une combinaison linéaire de z et w. On peut alors démontrer l’analogue du lemmed’Euclid sur Z[i]. On laisse les détails aux lecteurs.

On peut enfin répondre à notre question et classifier les entiers qui sont la somme dedeux carrés :

Théorème 5.9. Considérons n ∈ N et sa factorisation première n = pv11 · · · pvrr . Le nombren peut être écrit comme la somme de deux carrés si et seulement si 2|vi quand pi ≡ 3 (mod 4).

Démonstration. Si n = pv11 · · · pvrr possède la propriété que 2|vi quand pi ≡ 3 (mod 4), alorson peut écrire n = d2m, où

m =∏

1≤i≤rpi=2 ou pi≡1 (mod 4)

pi.

Du théorème 5.7, on trouve que pi = x2i + y2i quand pi ≡ 1 (mod 4). Aussi, on a trivialementque 2 = 12 + 12. Donc le lemme 5.4 implique que m est aussi la somme de deux carrés, soitm = x2 + y2. Par la suite, n = (dx) + (dy)2, ce qui est ce qu’il fallait démontrer.

Réciproquement, supposons que n = x2 + y2. On pose d = (x, y) et on écrit x = da ety = db, où (a, b) = 1, pour que n = d2(a2 + b2). Il suffit de montrer que a2 + b2 n’est pasdivisible par de nombres premiers p ≡ 3 (mod 4). En effet, soit p|a2 + b2, p > 2. Puisque(a, b) = 1, alors (ab, p) = 1. Donc

a2 + b2 ≡ 0 (mod p) =⇒ (ab−1)2 ≡ −1 (mod p) =⇒(−1

p

)= 1

=⇒ p ≡ 1 (mod 4),

ce qui termine la démonstration.

On donne ci-dessus une démonstration alternative et plus directe du théorème 5.7 enévitant la théorie des entiers gaussiens. Cependant, l’idée principale vient de cette théorie etune présentation de cet argument sans l’étude de Z[i] pourrait le faire apparaitre comme dela ‘magique.

Démonstration alternative du théorème 5.7. On a toujours que x2 ≡ 0, 1 (mod 4). Donc x2 +y2 ≡ 0, 1, 2 (mod 4), ce qui implique que si p > 2 est représentable comme la somme de deuxcarrés, alors nécessairement p ≡ 1 (mod 4).

Réciproquement, supposons que p ≡ 1 (mod 4). Donc(−1p

)= 1, c’est-à-dire il existe

r ∈ 1, . . . , p− 1 tel que r2 ≡ −1 (mod p). On pose M =⌊√

p⌋, pour que

M <√p < M + 1

(en général, on a que bxc ≤ x < bxc+ 1, mais dans ce cas on ne peut pas avoir que M =√p

parce que un nombre premier n’est pas un carré parfait). Soit

X = (a, b) ∈ Z2 : 0 ≤ a, b ≤M.

Page 90: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

90 CHAPITRE 5. ÉQUATIONS DIOPHANTIENNES

Pour chaque (a, b) ∈ X, on considère le nombre a + br. Puisque |X| = (M + 1)2 > p, lesnombres a + br ne peuvent pas être tous différents modulo p. Donc il existe deux élémentsde X (a, b) et (a′, b′) qui sont distincts et pour lesquels a+ br ≡ a′ + b′r (mod p). C’impliqueque (a− a′) ≡ r(b′ − b) (mod p) et, par la suite (a− a′)2 ≡ r2(b′ − b)2 ≡ −(b′ − b)2 (mod p).Donc le nombre

m := (a− a′)2 + (b− b′)2

est un multiple de p qui est positif car (a, b) 6= (a′, b′). De plus, on a que −M ≤ a′ − a ≤Met −M ≤ b′− b ≤M , ce qui implique que m ≤ 2M2 < 2p. Mais le seul multiple de p qui estdans l’intervalle (0, 2p) est p. Donc m = p = (a − a′)2 + (b − b′)2, ce qui est ce qu’il fallaitmontrer.

5.5 Sommes de quatre carrésOn a vu déjà que il y a de nombres entiers qui ne peuvent s’exprimer comme la somme

de deux carrés. La même chose est vraie pour les sommes de trois carrés : on a que 23 6=x2 + y2 + z2, pour tous x, y, z ∈ Z3. Cependant, Lagrange a montré le théorème suivant :

Théorème 5.10 (Lagrange). Chaque nombre naturel peut s’écrire comme la somme dequatre carrés.

Comme dans le cas de deux carrés, on commence avec un lemme préparatoire qui réduirele théorème aux nombres premiers :

Lemme 5.11. Si a et b sont de sommes de quatre carrés, alors la même chose est vraiepour ab.

Démonstration. Si a = x21 + x22 + x23 + x24 et b = y21 + y22 + y23 + y24, alors on peut vérifierfacilement que

ab = (x1y1 + x2y2 + x3y3 + x4y4)2 + (−x1y2 + x2y1 − x3y4 + x4y3)

2

+ (−x1y3 + x3y1 + x2y4 − x4y2)2 + (−x1y4 + x1y4 − x2y3 + x3y2)2,

(5.8)

d’où le lemme découle tout de suite.

Démonstration du théorème 5.10. Le lemme 5.11 nous permet de considérer seulement le casd’un nombre premier. Alors, soit p un nombre premier. Si p = 2, on a que 2 = 12+12+02+02,comme voulu. Supposons maintenant que p > 2. Si p ≡ 1 (mod 4), alors on peut utiliser lethéorème 5.7. Toutefois, on montre que p peut s’écrire comme la somme de quatre carrésavec un argument unifié pour touts les p > 2. Ici on ne peut pas « linéariser » le problème,comme on l’a fait au cas de deux carrés (voir démonstration alternative du théorème 5.7).On considère l’ensemble

A := a = x21 + x22 + x23 + x24 : xi ∈ Z (1 ≤ i ≤ 4), p|a, a > 0

et on montre que minA = p. Tout d’abord, il faut montrer que A 6= ∅, pour que son minimumsoit bien défini. Les nombres x2, 0 ≤ x ≤ (p− 1)/2, sont tous distincts modulo p. De même,

Page 91: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

5.5. SOMMES DE QUATRE CARRÉS 91

les nombres −1 − y2, 0 ≤ y ≤ (p − 1)/2, sont aussi distincts modulo p. Puisque il existeseulement p distincts classes de congruences modulo p, alors il existe 0 ≤ x, y ≤ (p − 1)/2tels que x2 ≡ −1 − y2 (mod p), ce qui implique que x2 + y2 + 12 + 02 ∈ A. Alors A 6= ∅,comme voulu. Soit

a = x21 + x22 + x23 + x24 = minA.

On a que a = mp, pour un m ∈ N. Il suffit de montrer que m = 1. D’abord, on montre quem est impair. En effet, si m était pair, alors x21 + x22 + x23 + x24 ≡ 0 (mod 2), ce qui impliqueque soit tous les xi sont impairs, soit ils sont tous pairs, soit il y en a deux qui sont pairset deux qui sont impairs. En tout cas, on peut écrire x1, x2, x3, x4 = xi1 , xi2 ∪ xi3 , xi4pour que xi1 ≡ xi2 (mod 2) et xi3 ≡ xi4 (mod 2). Donc

a

2=x2i1 + x2i2 + x2i3 + x2i4

2=

(xi1 + xi2

2

)2

+

(xi1 − xi2

2

)2

+

(xi3 + xi4

2

)2

+

(xi3 − xi4

2

)2

,

ce qui implique que a/2 ∈ A. C’est impossible car a = minA et a/2 < a. Donc m est impair,comme affirmé. L’idée maintenant est d’utiliser la relation (5.8) : si b = y21 +y22 +y23 +y24 > 0,alors

mpb = ab = (x1y1 + x2y2 + x3y3 + x4y4)2 + (−x1y2 + x2y1 − x3y4 + x4y3)

2

+ (−x1y3 + x3y1 + x2y4 − x4y2)2 + (−x1y4 + x1y4 − x2y3 + x3y2)2

=: z21 + z22 + z23 + z24 ∈ A.

Le but est de trouver b ≡ 0 (modm) tel que zi ≡ 0 (modm), pour tout i ∈ 1, 2, 3, 4. Dansce cas, on aura que pb/m = (z1/m)2+(z2/m)2+(z3/m)2+(z4/m)2 ∈ A. Si m > 1, on affirmequ’on peut choisir un tel b qui satisfait l’inégalité b < m2, ce qui implique que pb/m < pm =a = minA, une contradiction. En effet, pour tout i, on peut choisir yi ∈ Z/ ∩ (−m/2,m/2)tel que xi ≡ yi (modm). Si b = y21 + y22 + y23 + y24 = 0, alors yi = 0 pour tout i ∈ 1, . . . , 4et, par la suite, a/m2 = (x1/m)2 + (x2/m)2 + (x3/m)2 + (x4/m)2 ∈ A. C’est impossible cara/m2 < a = minA. Donc b > 0. De plus, on a que

b ≡ x21 + x22 + x23 + x24 (mod m)

≡ 0 (mod m)

et b < 4 · (m/2)2 = m2, comme voulu. Finalement, on a que

z1 = x1y1 + x2y2 + x3y3 + x4y4 ≡ x21 + x22 + x23 + x24 (mod m)

≡ 0 (mod m)

et, de même, z2 ≡ z3 ≡ z4 ≡ 0 (modm). Comme on a vu au-dessous, ceci nous amène à unecontradiction car c’implique que bp/m ∈ A bien que bp/m < mp = a = minA. Par la suite,il faut que m = 1 et le théorème découle.

Les quaternions de Hamilton

On conclut cette section avec une discussion qui donne une explication plus concret dulemme 5.11. Cette explication passe par les quaternions de Hamilton.

Page 92: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

92 CHAPITRE 5. ÉQUATIONS DIOPHANTIENNES

On sait qu’on peut identifier C avec le plan R2. Cependant, la structure multiplicativede C devient beaucoup plus claire et intuitive quand on utilise la notation a + bi au lieude (a, b). En effet, avec la règle i2 = −1, on trouve tout de suite que (a + ib)(c + id) =(ac− db) + i(ad+ bc), la multiplication familière de deux nombres complexes. Comme on l’avu, cette propriété est très importante dans l’étude des nombres qui peuvent s’écrire commela somme de deux carrés.

De même façon, une autre structure algébrique devient important dans l’étude des nombresqui sont la somme de quatre carrés. Cette structure est l’ensemble des quaternions de Ha-milton, c’est-à-dire l’ensemble

H := a+ bi+ cj + dk : a, b, c, d ∈ R,

où i, j, k sont de ‘nombres’ linéairement indépendants sur R. Alors, H est juste une autrefaçon d’écrire R4 (on identifie a+bi+cj+dk avec le vecteur (a, b, c, d)), exactement de mêmefaçon que C est une autre façon d’écrire R2.

Comme un espace linéaire, H possède d’une addition de ses éléments. On peut aussi lesmultiplier en introduisant les règles i2 = j2 = k2 = −1, ij = k, jk = i et ki = j. À partirde ces équations, on peut déduire que ji = j(jk) = j2k = −k, kj = k(ki) = k2i = −i etik = i(ij) = i2j = −j. En particulier, la multiplication dans H n’est pas commutative. Ensuivant les règles précédentes, on s’amène à la relation suivante :

(a+ bi+ cj + dk)(a′ + b′i+ c′j + d′k) = aa′ + ab′i+ ac′j + ad′k

+ ba′i+ bb′i2 + bc′ij + bd′ik

+ ca′j + cb′ji+ cc′j2 + cd′jk

+ da′k + db′ki+ dc′kj + dd′k2

= aa′ + ab′i+ ac′j + ad′k

+ ba′i− bb′ + bc′k − bd′j+ ca′j − cb′k − cc′ + cd′i

+ da′k + db′j − dc′i− dd′

= (aa′ − bb′ − cc′ − dd′) + (ab′ + ba′ + cd′ − c′d)i

+ (ac′ + ca′ − bd′ + db′)j + (ad′ + da′ + bc′ − cb′)k.

Puis, étant donné un quaternion α = a+ bi+ cj + dk, on défini sa norme N(α) := a2 + b2 +c2 + d2. On peut verifier que

N(α) = αα,

où α := a− bi− cj − dk est le conjugué de α. Aussi, on peut verifier que

αβ = αβ.

DoncN(αβ) = N(α)N(β).

En appliquant cette formule avec α = x1 + x2i + x3j + x4k et β = y1 − y2i − y3j − y4k, onarrive à (5.8).

Page 93: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

5.5. SOMMES DE QUATRE CARRÉS 93

Exercices

Exercice 5.1. Trouvez toutes les solutions composées de nombres entiers aux équationssuivantes :

(a) 10x+ 2y = 9 (b) 7x+ 11y = 20 (c) 10x+ 35y = 100.

Exercice 5.2. Supposez que vous avez 20 timbres de 7$ chaque et 10 timbres de 11$ chaque.Vous voulez envoyez à Toronto un colis qui coûte 151$. Est-ce que c’est possible de le payersans acheter d’autres timbres ? Dans combien de façons différentes vous pouvez le payer ?Est-ce que ce serait possible de payer le colis avec les timbres disponibles s’il coûtait 244$ ?

Exercice 5.3.(a) Trouvez tous les triplets pythagoriciens qui forment une progression arithmétique.(b) Trouvez toutes les solutions entières à l’équation x2 +y2 = z4 sachant que (x, y, z) = 1.

Exercice 5.4. L’équation x4 + x2 = y4 + 5 possède-t-elle des solutions entières en x et y ?

Exercice 5.5. Résolvez le système suivant :

2x(1 + y + y2) = 3(1 + y4)

2y(1 + z + z2) = 3(1 + z4)

2z(1 + x+ x2) = 3(1 + x4)

Exercice 5.6. Utilisez la méthode de la descente infinie pour montrer que l’équation x2 =2y2 n’a pas de solutions entiers (et, par la suite,

√2 /∈ Q).

Exercice 5.7.(a) Montrez que un nombre premier p > 2 peut être écrit comme x2 + 2y2, où x, y ∈ N, si

et seulement si p ≡ 1, 3 (mod 8).(b) Montrez que si p|a2 + 2b2 avec (a, b) = 1, alors soit p = 2 soit p ≡ 1, 3 (mod 8).(c) Déterminez quels sont les nombres naturels n qui peuvent s’écrire dans la forme x2+2y2.

Exercice 5.8. Est-ce que c’est possible de donner une structure multiplicative à R3 commeon a fait pour R2 et pour R4 ?

Page 94: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

94 CHAPITRE 5. ÉQUATIONS DIOPHANTIENNES

Page 95: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Deuxième partie

Méthodes analytiques

95

Page 96: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons
Page 97: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 6

Et il en exista infiniment beaucoup

Depuis la preuve d’Euclide qu’il existe un nombre infini de nombres premiers, la réparti-tion de ces objets fondamentaux a fasciné les mathématiciens. Différent d’autres suites quiont une structure très régulière, comme la suite des carrés, les nombres premiers ne semblentpas suivre un motif visible. Par conséquent, deviner la location exacte du n-ième premierapparaît être un défi impossible quand n devient de plus en plus grand.

Puisque la suite des premiers semble être si chaotique, on peut fixer l’objectif plus modestede comprendre la location approximative du n-ième premier. De façon équivalent, on chercheune bonne approximation à la fonction de dénombrement des nombres premiers

π(x) := #p ≤ x.

Si pn dénote le n-ième nombre premier, alors π(pn) = n, pour que chaque approximation àπ(x) peut se traduire immédiatement à une approximation à pn, et vice versa.

L’étude de la repartition de la repartition des premiers a préoccupé le jeune Gauss. Aprèsavoir examiné des tables de nombres premiers, il a observé que la densité des premiers autourde x est à peu prés 1/ log x. En le traduisant à la langue du calcul, ceci veut dire qu’unebonne approximation pour π(x) est donnée par l’intégrale logarithmique

li(x) :=

∫ x

2

dt

log t.

En appliquant la règle de l’Hôpital, on trouve que

limx→∞

li(x)

x/ log x= 1.

Donc l’estimation de Gauss implique que π(x) est approximativement égal à x/ log x quandx→∞. De façon symbolique, on écrit

π(x) ∼ x

log x(x→∞),(6.1)

qui veut dire que le rapport de ces deux fonctions tend vers 1 quand x → ∞. On discuteracette notation plus profondément dans la section 7.1. De manière équivalente, l’estimationde Gauss (6.1) constate que pn ∼ n log n quand n→∞ (exercice).

97

Page 98: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

98 CHAPITRE 6. ET IL EN EXISTA INFINIMENT BEAUCOUP

Cela a pris plus qu’une siècle de démontrer la conjecture de Gauss pour π(x). Le cheminde la preuve a été décrite par Riemann dans son mémoire Über die Anzahl der Primzahlenunter einer gegebenen Grösse qui a été publié en 1859 et qui a causé une révolution ausujet. Dans son travail, Riemann a expliqué comment π(x) est intimement lié aux propriétésanalytiques la fonction zeta de Riemann

ζ(s) =∞∑n=1

1

ns,

définie pour l’instant quand <(s) > 1. Il est procédé de proposer un programme dont lacomplétion amènerait à une comprehension profonde des nombres premiers et qui établiraitqu’il existe une constant c > 0 telle que

|π(x)− li(x)| ≤ c√x log x pour tout x ≥ 2,(6.2)

une forme très forte de l’estimation de Gauss. En 1895, von Mangoldt a prouvé rigoureuse-ment toutes les étapes du plan de Riemann, sauf une. Cette dernière étape dans son planreste insaisissable. C’est la fameuse hypothèse de Riemann qu’on discutera dans la section 9.Quand même, en 1896, Hadamard et de la Vallée Poussin ont montré une forme faible del’hypothèse de Riemann qui a été assez forte pour leur permettre d’établir l’estimation deGauss, connue aujourd’hui comme le théorème des nombres premiers :

Théorème des nombres premiers. Quand x→∞, on a que π(x) ∼ x/ log x.

On parlera de la démonstration de ce résultat fondamental à la section 9. Avant de le faire,on développe plusieurs outils et on démontre des autres résultats intermédiaires qui sontintéressantes eux-mêmes.

Page 99: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 7

Estimations asymptotiques

7.1 La notation asymptotiqueLes fonctions qu’on rencontre dans la théorie des nombres sont souvent irrégulières. Alors,

on veut les remplacer par d’autres fonctions qui s’en rapprochent et qui sont plus faciles àanalyser. Comme un exemple, considérons la fonction f(x) qui compte le nombre d’entiersdans l’intervalle [1, x] avec x ≥ 1. On peut facilement voir que f est une fonction en escalierqui a de sauts de longueur 1 à tous les entiers. On peut écrire f en termes d’une fonctionplus familière, la partie entière de x qu’on dénote par bxc. Puisque bxc ≤ x < x + 1, c’estclair que f(x) = bxc, d’où f(x) = x + E(x) pour une fonction E(x) bornée par 1 en valeurabsolue. On a donc remplacé la fonction en escalier f(x) = bxc par son approximation lissex, et le terme restant de cette approximation est une fonction bornée. On exprime ce faitpar la formule asymptotique

bxc = x+O(1).(7.1)

Généralement, étant données les fonctions complexes f, g and h, et un sous-ensemble I deleurs domaines de définition, on écrit

f(x) = g(x) +O(h(x)) (x ∈ I),(7.2)

et on lit ‘f(x) est égale à g(x) plus grand-O de h(x)’, s’il existe une constante c = c(f, g, I)telle que

|f(x)− g(x)| ≤ c · h(x) pour chaque x ∈ I.On appelle souvent la constante c absolue pour signifier qu’elle ne dépend pas de l’argumentdes fonctions f, g et h, ni d’autres paramètres qui peuvent être présents.

On remarque que la différence x−bxc dans (7.1) est la partie fractionnelle de x, dénotéepar x. Cependant, c’est souvent plus simple d’ignorer la valeur exacte du terme restant etde juste garder en tête que il est une fonction bornée. Supposons, par exemple, qu’on veuttrouver une approximation de l’expression

∑n≤x bx/nc. Le pouvoir de la notation asymp-

totique se révèle dans l’évaluation approximative de telles expressions compliquées, car elletransforme des inégalités à des égalités : on a que

∑n≤x bx/nc = x

∑n≤x 1/n+O(x), car∣∣∣∣∣∑

n≤x

bx/nc − x∑n≤x

1/n

∣∣∣∣∣ =

∣∣∣∣∣∑n≤x

(bx/nc − x/n)

∣∣∣∣∣ ≤∑n≤x

1 ≤ x.

99

Page 100: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

100 CHAPITRE 7. ESTIMATIONS ASYMPTOTIQUES

Mais il faut faire attention : les règles usuelles de l’addition et de la multiplication changent.Par exemple, puisque la somme de deux fonctions bornées est aussi bornée, on a que O(1) +O(1) = O(1). De manière similaire, on a que O(1) ·O(1) = O(1) and O(1)−O(1) = O(1).

La notation asymptotique nous permet aussi de comparer l’ordre de magnitude de fonc-tions différentes : si

f(x) = O(g(x)) (x ∈ I),

alors on dit que “f a plus petite ordre de magnitude que g sur I". On peut aussi exprimerla relation asymptotique ci-dessus en utilisant la notation de Vinogradov :

f(x) g(x) (x ∈ I).

Si f(x) g(x) et g(x) f(x) pour tout x ∈ I, alors on écrit

f(x) g(x) (x ∈ I)

et on dit que “f et g ont la même ordre de magnitude sur I”.

Il existe deux autres notations asymptotiques importantes. On écrit

f(x) = o(g(x)) (x→ x0) ⇔ limx→x0

f(x)

g(x)= 0

et

f(x) ∼ g(x) (x→ x0) ⇔ limx→x0

f(x)

g(x)= 1,

où dans les deux définitions x0 ∈ R = R ∪ −∞,+∞ et g est non-zéro dans un voisinagede x0.

On donne ci-dessous quelques exemples afin d’illustrer l’utilisation des notations asymp-totiques qu’on a introduit.

Exemple 7.1. Souvent on a une expression composée qu’on veut évaluer, comme parexemple log bxc. Puisque bxc = x + O(1), alors le théorème des accroissements finis im-plique que

log bxc = log x+O(1) · 1

c,

pour un c entre bxc and x. Par la suite,

log bxc = log x+O(1/x) (x ≥ 1).

Exemple 7.2. Une application simple du théorème des accroissements finis est souventinsuffisant car on a besoin de précision extra dans notre approximation. Dans ce cas, on peututiliser le théorème de Taylor. Par exemple, on a

√x+ log x =

√x+

log x

2√x− log2 x

4x3/2+O

(log3 x

x5/2

)(x ≥ 1).

Page 101: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

7.2. UNE PREUVE ANALYTIQUE DE L’INFINITÉ DES PREMIERS 101

Exemple 7.3. La notation asymptotique peut être aussi utilisée pour obtenir des expansionsasymptotiques d’intégrales qu’on ne peut pas calculer exactement en termes de fonctionsélémentaires. Comme un exemple, on analyse l’intégrale logarithmique. Par intégration parparties, on a que

li(x) =

∫ x

2

x′dy

log y

=x

log x+O(1) +

∫ x

2

dy

log2 y

=x

log x+

x

log2 x+O(1) + 2

∫ x

2

dy

log3 y...

=x

log x+

x

log2 x+

2!x

log3 x+ · · ·+ (N − 1)!x

logN x+ON(1) +N !

∫ x

2

dy

logN+1 y.

La dernière intégrale est ∼ x/ logN+1 x quand x → ∞ d’après la règle de l’Hôpital’s. Onarrive donc à la formule asymptotique

li(x) =x

log x+

x

log2 x+

2!x

log3 x+ · · ·+ (N − 1)!x

logN x+ON

(x

(log x)N

)(x ≥ 2).

7.2 Une preuve analytique de l’infinité des premiers

Pour donner une idée du pouvoir de la méthode analytique, on donne une démonstrationanalytique de l’infinité des nombres premiers. Pour décrire l’idée, on considère la possibilitéabsurde que le nombre 2 est le seul nombre premier. Puisque chaque entier positif peut sefactoriser en premiers, il suit que chaque entier positif est une puissance de 2. En particulier,

n ≤ x = 2k ≤ x : k ≥ 0.

Le côté gauche a cardinalité bxc = x + O(1) ∼ x quand x→∞. Par contre, le côté droit acardinalité

#2k ≤ x : k ≥ 0 = #0 ≤ k ≤ log x/ log 2 = 1 + blog x/ log 2c =log x

log 2+O(1) ∼ log x

log 2

quand x→∞. Mais ceci est absurd car limx→∞log xx

= 0. On a montré alors que ce n’est paspossible que 2 est le seul nombre premier pour des raisons analytiques : il n’y a pas assez depuissances de 2 pour créer tous les nombres !

On peut généraliser cette idée : supposons que les seuls nombres premiers étaient 2 et 3.Donc

n ≤ x = 2k3` ≤ x : k, ` ≥ 0.

Page 102: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

102 CHAPITRE 7. ESTIMATIONS ASYMPTOTIQUES

Mais on a que

#2k3` ≤ x : k, ` ≥ 0 ≤ #(k, `) ∈ Z2 : 0 ≤ k ≤ log x/ log 2, 0 ≤ ` ≤ log x/ log 3

≤(

1 +log x

log 2

)(1 +

log x

log 3

)∼ (log x)2

(log 2)(log 3)= ox→∞(x),

ce qui est absurd.Plus généralement, si on suppose que les seuls nombres premiers sont p1, . . . , pm, alors

n ≤ x = pk11 · · · pkmm : k1, . . . , km ≥ 0.

Cependant,

#pk11 pk22 · · · pkmm : k1, . . . , km ≥ 0 ≤ #(k1, . . . , km) ∈ Zm : 0 ≤ kj ≤ log x/ log pj ∀j

≤m∏j=1

(1 +

log x

log pj

)∼ (log x)m∏m

j=1 log pj= ox→∞(x)

d’après la règle de l’Hôpital. On est arrivé encore à une contradiction. Ceci montre l’infi-nité des premiers. En fait, l’argument ci-dessus a la capacité d’estimer π(x) si utilisé avecdextérité. On voit alors la puissance potentielle des méthodes analytiques.

7.3 Sommation par partiesUn des outils principaux de la théorie analytique des nombres est une analogie discrète

de l’intégration par parties. Elle est appelée sommation par parties ou sommation partielle, etsa forme la plus simple est la formule de sommation d’Abel :

N∑n=M+1

anbn = Anbn

∣∣∣Nn=M−

N−1∑n=M

An(bn+1 − bn),(7.3)

où An = a1 + · · ·+ an. La formule d’Abel est prouvée en observant que an = An − An−1 et,puis, en re-arrangeant la sommation :

N∑n=M+1

anbn =N∑

n=M+1

Anbn −N∑

n=M+1

An−1bn =N∑

n=M+1

Anbn −N−1∑n=M

Anbn+1,

où on a fait le changement de variables n→ n+ 1 à la deuxième somme. Puisque

N∑n=M+1

Anbn = ANbN − AMbM +N−1∑n=M

Anbn,

Page 103: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

7.3. SOMMATION PAR PARTIES 103

la relation (7.3) suit.La formule de sommation d’Abel nous permet de comprendre les sommes partielles de

anbn, à condition qu’on sache déjà le comportement de An et de bn. Dans le cas spécial oùbn = f(n) pour une fonction f qui est continûment differentiable, la formule d’Abel peutêtre écrite en termes de l’intégrale de Riemann : on a que

N−1∑n=M

An(bn+1 − bn) =N−1∑n=M

An(f(n+ 1)− f(n)) =N−1∑n=M

An

∫ n+1

n

f ′(t)dt.

En observant que la fonction en escalier A(x) :=∑

1≤n≤x an est constante pour x ∈ (n, n+1),on a que

N−1∑n=M

An(bn+1 − bn) =N−1∑n=M

∫ n+1

n

A(t)f ′(t)dt =

∫ N

M

A(t)f ′(t)dt.

On déduit alors que

N∑n=M+1

anf(n) = A(x)f(x)∣∣∣Nn=M−∫ N

M

A(t)f ′(t)dt.

Plus généralement, on peut montrer de manière similaire que∑y<n≤z

anf(n) = A(t)f(t)∣∣∣zt=y−∫ z

y

A(t)f ′(t)dt(7.4)

pour y, z ∈ R≥0.Souvent, l’information qu’on a concernant A(x) est dans une forme asymptotique :

A(x) = M(x) + R(x), où M(x) est le terme principal, donné par une fonction continû-ment differentiable, et R(x) est le terme restant à l’approximation de A(x) par M(x). Dansce cas, on a ∑

y<n≤z

anf(n) = M(t)f(t)∣∣∣zt=y−∫ z

y

M(t)f ′(t)dt

+R(t)f(t)∣∣∣zt=y−∫ z

y

R(t)f ′(t)dt.

On peut réécrire la première ligne en utilisant intégration par parties. On trouve alors que∑y<n≤z

anf(n) =

∫ z

y

f(t)M ′(t)dt+R(t)f(t)∣∣∣zt=y−∫ z

y

R(t)f ′(t)dt.(7.5)

Dans le cas spécial où an = 1, on a que A(x) = bxc, et on l’écrit comme x− x. Ceci nousamène à la formule de sommation d’Euler-McLaurin :

Théorème 7.4. Si f est continûment differentiable sur [y, z], alors∑y<n≤z

f(n) =

∫ z

y

f(t)dt− tf(t)∣∣∣zt=y

+

∫ z

y

tf ′(t)dt.

Page 104: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

104 CHAPITRE 7. ESTIMATIONS ASYMPTOTIQUES

En particulier, si f est continûment differentiable sur [1,+∞), alors

∑n≤x

f(n) =

∫ x

1

f(t)dt+ f(1)− xf(x) +

∫ x

1

tf ′(t)dt.

Remarque 7.5. On peut considérer∑

y<n≤z f(n) comme une somme de Riemann pourl’intégrale

∫ zyf(t)dt. Bien sûr, ici on fait la sommation sur une (quasi-)partition de [y, z] de

diamètre 1, alors la différence∑

y≤n≤z f(n) −∫ zyf(t)dt pourrait être assez grande. Cepen-

dant, si f n’oscille pas trop (c’est-à-dire si sa dérivée est habituellement petite), alors cettedifférence devrait être assez petite. La formule d’Euler-McLaurin est une quantification decette idée.

On donne maintenant deux applications fameuses de la formule d’Euler-McLaurin. Oncommence par une estimation de la croissance de la série harmonique. Le symbole γ dansson énoncé dénote la constante d’Euler-Mascheroni, définie par

γ = 1−∫ ∞1

tt2

dt = 0.57721 . . .

Théorème 7.6. Pour tout x ≥ 1, on a que

∑n≤x

1

n= log x+ γ +O

(1

x

).

Démonstration. D’après le théorème 7.4, on a que

∑n≤x

1

n=

∫ x

1

dt

t+ 1− x

x−∫ x

1

tt2

dt

= log x+ 1−∫ x

1

tt2

dt+O

(1

x

).

L’intégrale∫∞1tt−2dt converge absolument. De plus, on a l’estimation suivante pour sa

queue : ∣∣∣∣∫ ∞x

tt2

dt

∣∣∣∣ ≤ ∫ ∞x

dt

t2=

1

x,

ce qui complète la preuve du théorème.

Une application plus compliquée du théorème 7.4 est donnée par l’approximation deStirling de la fonction factorielle :

Théorème 7.7 (Stirling’s formula). Pour chaque entier n ≥ 1, on a que

n! =(ne

)n√2πn

(1 +O

(1

n

)).

Page 105: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

7.3. SOMMATION PAR PARTIES 105

Démonstration. On considére le logarithme de n! et on utilise la formule d’Euler-McLaurinpour le réécrire :

log(n!) =n∑j=1

log j =

∫ n

1

log x dx+ log 1− n log n+

∫ n

1

tt

dt

= n log n− n+ 1 +

∫ n

1

tt

dt,

puisque ici n ∈ N et, par conséquent, n = 0. Puis, on pose

F (x) =

∫ x

0

(t − 1/2)dt.

Le fait que t − 1/2 est une fonction 1-périodique de moyenne 0 sur une période complète(i.e.

∫ 1

0(t − 1/2)dt = 0) implique que F est aussi 1-périodique. En particular, F (n) = 0

pour chaque n ∈ N, et F (x) = O(1) pour tout x ≥ 1. En intégrant par parties, on trouveque ∫ n

1

tt

dt =log n

2+

∫ n

1

t − 1/2

tdt =

log n

2+F (t)

t

∣∣∣∣nt=1

+

∫ n

1

F (t)

t2dt

=log n

2+

∫ n

1

F (t)

t2dt.

(Justifiez pourquoi on peut intégrer par parties, même si F n’est pas differentiable partout.)L’intégrale

∫∞1F (t)t−2dt converge absolument car F (t) = O(1). De plus, sa queue satisfait

la borne ∫ ∞n

F (t)

t2dt

∫ ∞n

dt

t2=

1

n.

Ceci montre que log(n!) = (n − 1/2) log n − n + c + O(1/n) pour une certaine constante c.Puisque eO(1/n) = 1 +O(1/n) par le théorème de Taylor, la preuve sera complète à conditionqu’on puisse montrer que ec =

√2π. L’argument est expliqué à l’exercise 7.8 ci-dessous.

Exercices

Exercice 7.1. Considérez les fonctions suivantes :

f1(x) = x1/ log log x, f2(x) = e√log x, f3(x) = x, f4(x) = (log x)A, f5(x) =

√x,

f6(x) = ex, f7(x) =x

(log x)A, f8(x) =

x

e√log x

, f9(x) = log log x,

où A > 0 est fixé mais arbitrairement grand. Ordonnez ces fonctions en termes de leur ordrede magnitude quand x→∞.

Exercice 7.2. Montrez les résultats asymptotiques suivants :(a) log(1 + δ) = δ +O(δ2) pour δ ∈ [−1/2, 1/2] ;

Page 106: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

106 CHAPITRE 7. ESTIMATIONS ASYMPTOTIQUES

(b)√x+ 1 =

√x+O(1/

√x) pour x ≥ 1 ;

(c) eδ = 1 +O(δ) pour|δ| ≤ 1 ;(d) Si p > 1, alors

∑n>x 1/np p x

1−p pour x ≥ 1 ;(e) Soit λ ∈ (0, 1) et considérez une an∞n=1 ⊂ R≥0 telle que

an+1 ≤ λan (n ≥ 1).

Donc ∑n≥N

an λ aN .

Exercice 7.3. (a) Prouvez que∑n≤x

√n =

2

3x3/2 +O(

√x) (x ≥ 1)

(b) Prouvez qu’il existe une constante c telle que∑n≤x

1√n

= 2√x+ c+O

(1√x

)(x ≥ 1).

Exercice 7.4. (a) Observez que si f : [1,+∞) → [0,∞) est une fonction décroissante,alors ∫ n+1

n

f(t)dt ≤ f(n) ≤∫ n

n−1f(t)dt,

et déduisez que ∫ ∞bxc+1

f(t)dt ≤∑n>x

f(n) ≤∫ ∞bxc

f(t)dt.

(b) Prouvez que1

δxδ≤∑n>x

1

n1+δ≤ 1

δ(x− 1)δ(δ > 0, x ≥ 2),

etlog x ≤

∑n≤x

1

n≤ 1 + log x (x ≥ 1).

Exercice 7.5. Si (an)n≥1 est une suite de nombres complexes et A(x) =∑

n≤x an, alorsmontrez que ∑

n≤x

an log n = A(x) log x−∫ x

1

A(t)

tdt.

Déduisez que ∑n≤x

log n = x log x+O(log x) (x ≥ 1).

Exercice 7.6. Soit (an)∞n=1 une suite de nombres complexes.

Page 107: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

7.3. SOMMATION PAR PARTIES 107

(a) Si

limx→∞

1

x

∑n≤x

an = `,(7.6)

alors montrez que

limx→∞

1

log x

∑n≤x

ann

= `.(7.7)

(b) Construisez un exemple d’une suite de nombres an ∈ [0, 1] pour laquelle la limite dans(7.6) n’existe pas, mais la limite dans (7.7) existe.

Exercice 7.7. Cet exercise développe plus loin l’argument dans la démonstration du théo-rème 7.7.

On définit la suite des polynômes de Bernoulli Bn(x) et des nombres de Bernoulli Bn

comme suivant : on met B0(x) = B0 = 1, B1 = −1/2 et B1(x) = x + B1. Puis, on poseB2(x) = B2 + 2

∫ x0B1(x)dx, où B2 est tel que

∫ 1

0B2(x)dx = 0, c’est-à-direh B2(x) = x2 −

x+ 1/6. Généralement, en supposant qu’on a défini Bn(x), on pose Bn+1(x) = Bn+1 + (n+

1)∫ x0Bn(t)dt, où Bn+1 est tel que

∫ 1

0Bn+1(x)dx = 0.

(a) Pour n 6= 1, montrez que Bn(1) = Bn(0) = Bn. Concluez que la fonction x→ Bn(x)est 1-périodique et continue, et que

∫ x0Bn(t)dt = (Bn+1(x)−Bn+1)/(n+ 1).

(b) Pour n, k ∈ Z≥1, montrez que

log n! = (n+ 1/2) log n− n+ 1−k∑`=2

B`

`(`− 1)(1− n1−`) +

∫ n

1

Bk(x)kxk

dx.

(c) Généralement, pour si a < b sont deux entiers, et f est une fonction lisse, alors montrezque ∑

a<n≤b

f(n) =

∫ b

a

f(x)dx+k∑`=1

(−1)`B`

`!(f (`−1)(b)− f (`−1)(a))

+ (−1)k+1

∫ b

a

Bk(x)f (k)(x)

k!dx.

(d) Montrez que ∫ 1

0

Bk(x)e−2πimxdx = −1m 6=0k!

(2πim)k

et concluez que pour k ≥ 2 on a

Bk(x) = − k!

(2πi)k

∑m 6=0

e2πimx

mk.

(e) Pour k ≥ 1, montrez que B2k+1 = 0 et que

B2k =(2k)!

22k−1π2k

∞∑m=1

1

m2k=

(2k)!ζ(2k)

22k−1π2k.

Page 108: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

108 CHAPITRE 7. ESTIMATIONS ASYMPTOTIQUES

(f) Prouvez que Bn(x) =∑n

k=0

(nk

)Bn−kx

k et déduisez que Bn(x+ 1) = Bn(x) + nxn−1.(g) Prouvez la formule récursive Bn = −(n + 1)−1

∑n+1k=2

(n+1k

)Bn+1−k pour n ≥ 1 et en

déduisez que |Bn| ≤ (4/5)nn!.(h) Considérez la séries génératrice F (z, x) =

∑∞n=0Bn(x)zn/n!. Prouvez que ∂F/∂x = zF ,

ainsi que F (z, 1)− F (z, 0) = z. Déduisez que F (z, x) = ezxz/(ez − 1).(i) Montrez que z/(ez − 1) + z/2 est une fonction paire (i.e. ses valuers en z et −z sont

égales) et donnez une preuve différente du fait que B2n+1 = 0 pour n ≥ 1.(j) En notant que z/(ez − 1) = 1/(1 +

∑∞n=1 z

n/(n + 1)!), donnez une formule explicitepour Bn.

Exercice 7.8. Complétez la démonstration du théorème 7.7 comme suivant :(a) Montrez par induction que, pour chaque n ∈ Z≥0,

In :=

∫ π/2

0

(cosx)ndx =

π

2· 1 · 3 · · · (2k − 1)

2 · 4 · · · (2k)=π

2·(2kk

)4k

si n = 2k,

2 · 4 · · · (2k)

1 · 3 · · · (2k + 1)=

4k

(2k + 1)(2kk

) si n = 2k + 1,

(b) Pour chaque δ ∈ (0, π/2], posons

In(δ) :=

∫ δ

0

(cosx)ndx.

Montrez queIn −

π

2(cos δ)n ≤ In(δ) ≤ In.

(c) Pour chaque δ ∈ (0, π/2], montrez que

(cos δ) ·In − π

2(cos δ)n

In≤ In+1

In≤ 1.

Déduisez que

limn→∞

In+1

In= 1

et complétez la démonstration du théorème 7.7.

Exercice 7.9. Trouvez la valeur moyenne asymptotique du plus grand commun diviseur dea et b, quand a et b sont choisis de façon uniforme parmi tous les entiers ≤ x. C’est-à-dire,calculez

limx→∞

1

x2

∑a,b≤x

(a, b).

Page 109: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 8

La convolution de Dirichlet

8.1 La méthode de l’hyperboleUne fonction arithmétique est une fonction de la forme f : N → C (c’est-à-dire une

suite de nombres complexes). Par exemple, f pour être la fonction indicatrice des nombrespremiers. Un autre exemple classique d’importance arithmétique est la fonction diviseur

τ(n) := #d|n.

On observe qu’on peut l’écrire comme

τ(n) =∑d|n

1 =∑ab=n

1,

où tous les variables sont supposées d’être de nombres naturels. C’est un exemple d’uneconvolution de Dirichlet. Généralement, étant données deux fonctions arithmétiques f et g,leur convolution de Dirichlet est une nouvelle fonction arithmétique dénotée par f ∗ g etdéfinie par

(f ∗ g)(n) :=∑d|n

f(d)g(n/d) =∑ab=n

f(a)g(b).

Donc, on a queτ = 1 ∗ 1.

Un autre exemple important est donné en analysant la fonction logarithmique. Si n =pv11 · · · pvrr est la factorisation de n en facteurs premiers, alors

log n = v1 log p1 + · · ·+ vr log pr

= log p1 + · · ·+ log p1︸ ︷︷ ︸v1 fois

+ · · ·+ log pr + · · ·+ log pr︸ ︷︷ ︸vr fois

=∑pj |n

log p.

Donc, si on définit la fonction de von Mangoldt par

Λ(n) =

log p si n = pj pour un premier p et un entier j ≥ 1,

0 sinon,

109

Page 110: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

110 CHAPITRE 8. LA CONVOLUTION DE DIRICHLET

alors

log = Λ ∗ 1.(8.1)

Quand une fonction arithmétique f est la convolution de Dirichlet de deux autres fonc-tions g et h qui sont plus simples, on peut trouver une approximation de ses sommes partiellesen utilisant ce qu’on sait concernant les sommes partielles de g et de h. On décrit l’idée enétudiant l’exemple concrète de la fonction diviseur. Puisque τ = 1 ∗ 1, alors∑

n≤x

τ(n) =∑n≤x

(1 ∗ 1)(n) =∑n≤x

∑ab=n

1 =∑ab≤x

1.

Une manière de réarranger cette somme est de fixer a et sommer sur b (théorème de Fubinidiscrète). Ceci nous amène à la formule∑

n≤x

τ(n) =∑a≤x

∑b≤x/a

1 =∑a≤x

(xa

+O(1))

= x∑a≤x

1

a+O(x)

= x log x+O(x),

(8.2)

où on a utilisé le théorème 7.6. Ceci est une formule asymptotique véritable, mais le termed’erreur est juste un plus petit que le terme principal. On voudrait avoir une meilleure ap-proximation. En réexaminant notre argument, on remarque que l’approximation

∑b≤x/a 1 =

x/a + O(1) n’est par très bonne quand a est grand. Plutôt, quand a est grand, cela seraitbeaucoup mieux de changer les rôles de a et de b, en fixant b et en sommant premièrementsur a. De façon plus formelle, étant donnés deux paramètres A,B ≥ 1 avec AB = x, on peutréarranger la sommation comme suivant :∑

n≤x

τ(n) =∑ab≤x

1 =∑ab≤xa≤A

1 +∑ab≤xa>A

1 =∑a≤A

∑b≤x/a

1 +∑b≤B

∑A<a≤x/b

1.

On observe que ∑A<a≤x/b

1 =∑a≤x/b

1−∑a≤A

1.

Par la suite,∑n≤x

τ(n) =∑a≤A

∑b≤x/a

1 +∑b≤B

∑a≤x/b

1−(∑a≤A

1

)(∑b≤B

1

)(8.3)

=∑a≤A

(xa

+O(1))

+∑b≤B

(xb

+O(1))− (A+O(1))(B +O(1)).

En appliquant deux fois le théorème 7.6 et en se rappelant que AB = x, on déduit que∑n≤x

τ(n) = x

(log(AB) + 2γ +O

(1

A+

1

B

))− AB +O(A+B)

= x log x+ (2γ − 1)x+O(A+B).

Le choix optimal est A = B =√x, et il nous amène au résultat suivant :

Page 111: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

8.1. LA MÉTHODE DE L’HYPERBOLE 111

Théorème 8.1. Pour x ≥ 1, on a que∑n≤x

τ(n) = x log x+ (2γ − 1)x+O(√x).

Ce théorème est grâce à Dirichlet. La méthode de sa preuve est souvent appelée la mé-thode de l’hyperbole de Dirichlet. Son nom est justifié par une réévaluation géométrique de ladémonstration : la somme

∑n≤x τ(n) =

∑ab≤x 1 compte le nombre des points du réseau N×N

sous l’hyperbole ab = x, c’est-à-dire la cardinalité de l’ensemble N = (a, b) ∈ N2 : ab ≤ x.La manière dont on a réarrangé la sommation correspond à la décomposition de N commeX ∪ Y , où X = (a, b) ∈ N2 : a ≤ A and Y = (a, b) ∈ N2 : b ≤ B. Par la principe del’inclusion-exclusion, on a que∑

n≤x

τ(n) = |X ∪ Y | = |X|+ |Y | − |X ∩ Y |,

qui est la relation (8.3). La méthode de l’hyperbole est très utile et on va la réutiliser dansle prochain chapitre.

Exercices

Exercice 8.1. Soit A l’ensemble de toutes les fonctions arithmétiques, et soitM l’ensemblede toutes les fonctions multiplicatives.

(a) Montrez que la convolution de Dirichlet est une opération commutative : f ∗ g = g ∗ fpour tous f, g ∈ A.

(b) Montrez que la convolution de Dirichlet est une opération associative : (f ∗ g) ∗ h =f ∗ (g ∗ h) pour tous f, g, h ∈ A.

(c) Soit e ∈ A, définie par e(n) = 1n=1. Montrez que e est l’élément neutre de la convolu-tion de Dirichlet, c’est-à-dire f ∗ e = f pour chaque f ∈ A.

(d) Soit f ∈ A. On dit que la fonction arithmétique g est l’inverse de Dirichlet de g sif ∗ g = e. Montrez que g existe si et seulement si f(1) 6= 0. [Indice : construisez g defaçon inductive, en mettant g(n) = f(1)−1

∑d|n, d>1 f(d)g(n/d).]

(e) Montrez que (M, ∗) est un groupe abélien.(f) Soit f ∈ M, et soit g son inverse de Dirichlet. Calculez g(p) et g(p2) pour p premier

en termes des valeurs de f .

Exercice 8.2. Soit µ la fonction de Möbius, définie par

µ(n) :=

(−1)r si n est sans-carré 1 et a r facteurs premiers,0 sinon.

(a) Montrez que µ est l’inverse de Dirichlet de 1.(b) Prouvez que si f = 1 ∗ g, alors g = µ ∗ f .(c) Montrez que Λ = µ ∗ log, ainsi que Λ = −1 ∗ µ log.

Page 112: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

112 CHAPITRE 8. LA CONVOLUTION DE DIRICHLET

(d) Montrez que si f est complètement multiplicative et g est l’inverse de Dirichlet de f ,alors g = µf .

(e) Montrez que φ = I ∗ µ, où I(n) := n. [Indice : utilisez la multiplicativité de φ.](f) Montrez que µ2 = 1 ∗ f , où f(n) = 0 si n n’est pas un carré parfait, et f(n) = µ(m) si

n = m2. [Indice : utilisez la multiplicativité de µ2.](g) Montrez que 2ω = 1 ∗ µ2, où ω(n) = #p|n. [Indice : multiplicativité.]

Exercice 8.3. Montrez que ∑n≤x

ω(n) = x log log x+O(x).

pour tout x ≥ 3. [Indice : ω(n) =∑

p|n 1.]

Exercice 8.4. Définissons la k-ième fonction diviseur τk(n) := #(d1, . . . , dk) ∈ Nk :d1 · · · dk = n.(a) Montrez que τk est multiplicative.(b) Montrez qu’il existe un polynôme Pk de degrè k − 1 tel que∑

n≤x

τk(n) = x · Pk(log x) +Ok(x1−1/k) (x ≥ 1).

Calculez le coefficient Calculate the leading coefficient de tête de Pk.

Exercice 8.5. Pour chaque k ∈ N, on définit la k-ième fonction généralisée de von Mangoldtfunction par Λ(k) = µ ∗ logk. Prouvez que :(a) Λ(k+1) = Λ(k) log +Λ(k) ∗ Λ ;(b) Λk est supporté sur les entiers avec ≤ k facteurs premiers distincts ;(c) Si n = p1 · · · pk, où p1, . . . , pk sont de nombres premiers distincts, alors Λ(k)(n) =

(log p1) · · · (log pk).(d) 0 ≤ Λ(k)(n) ≤ (log n)k pour chaque n ∈ N ;

Exercice 8.6. Montrez qu’il existe une constante c > 0 telle que

#n ≤ x : n is square-free = cx+O(√x) (x ≥ 1).

[Indice : Utilisez l’exercice 8.2(e) et la version triviale de la méthode de l’hyperbole (cf.relation (8.2))]

Exercice 8.7. Un nombre n est appelé plein de carrés si p2|n pour chaque facteur premierp de n.

(a) Montrez que n est plein de carrés si et seulement s’il peut s’écrire comme n = a2b3

pour quelques a, b ∈ N.(b) Prouvez que

#n ≤ x : n est plein de carrés √x (x ≥ 1).

Page 113: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

8.2. LES THÉORÈMES DE CHEBYSHEV ET DE MERTENS 113

Exercice 8.8. (a) Si f dénote la fonction indicatrice de la suite des nombres pleins decarrés, alors montrez que f(n) =

∑a2b3=n µ

2(b).(b) Montrez qu’il existe deux constantes c1, c2 ∈ R telles que

#n ≤ x : n est plein de carrés = c1x1/2 + c2x

1/3 +O(x1/5).

8.2 Les théorèmes de Chebyshev et de Mertens

On utilise maintenant la méthode de l’hyperbole pour étudier la répartition des nombrespremiers. Notre point de départ est la relation (8.1). Donc, au lieu de donner une approxi-mation à la fonction π(x), on introduit les fonctions de Chebyshev

ψ(x) :=∑n≤x

Λ(n) =∑pk≤x

log p

etθ(x) :=

∑p≤x

log p.

Comme on va montrer tout de suite, une approximation pour π(x) peut se transformerfacilement à une estimation pour θ(x) et ψ(x). Le converse est aussi vrai.

Pour voir notre affirmation, on commence en observant que θ(x) =∑

n≤x an log n, oùan = 1n est premier, et on a enlevé le terme avec n = 1 car a1 = 0. En appliquant la formule(7.4) avec f(n) = log n, on trouve alors que

θ(x) = π(x) log x−∫ x

1

π(t)

tdt.(8.4)

Réciproquement, on a que

π(x) =∑

2−ε<n≤x

anlog n

pour chaque ε > 0, où an = 1n est premier log n. En appliquant 7.4 avec f(n) = 1/ log n, onobtient la relation

π(x) =θ(x)

log x+

∫ x

2−ε

θ(t)

t log2 tdt

pour chaque ε > 0. On laisse ε→ 0+ afin de déduire que

π(x) =θ(x)

log x+

∫ x

2

θ(t)

t log2 tdt.(8.5)

Donc, on voit qu’un estimation approximative pour π(x) peut se transformer tout de suiteà une approximation pour θ(x), et vice versa.

Page 114: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

114 CHAPITRE 8. LA CONVOLUTION DE DIRICHLET

De plus, on peut lier θ(x) et ψ(x) : on a que

0 ≤ ψ(x)− θ(x) =∑

pk≤x, k≥2

log p =∑p≤√x

log p∑

2≤k≤log x/ log p

≤∑p≤√x

log p · log x

log p

=∑p≤√x

log x ≤√x log x.

(8.6)

On attend à ce que ψ(x) soit ∼ x, et la fonction√x log x est minuscule en comparaison avec

la fonction x.Comme une application des relations (8.4), (8.5) et (8.6), on invite le lecteur de vérifier

que les relations suivantes sont équivalentes quand x→∞ :

π(x) ∼ x

log x, θ(x) ∼ x, ψ(x) ∼ x.

Le premier théorème qu’on montrera concernant la repartition des premiers est queπ(x) x/ log x, c’est-à-dire l’ordre de magnitude de π(x) est celle prévue par la conjec-ture de Gauss :

Théorème 8.2 (Chebyshev). Pour x ≥ 2, on a que

π(x) x

log x, θ(x) x, et ψ(x) x.

Démonstration. Selon la discussion précédente, il suffit de montrer que ψ(x) x ; les autresrésultats suivent tout de suite par (8.6) et (8.5).

Vu que log = Λ ∗ 1, on a que

S(x) :=∑n≤x

log n =∑n≤x

(Λ ∗ 1)(n) =∑n≤x

∑ab=n

Λ(a) =∑ab≤x

Λ(a).

On réarrange la sommation en fixant b et en sommant d’abord sur a. On trouve alors que∑n≤x

log n =∑b≤x

∑a≤x/b

Λ(b) =∑b≤x

ψ(x/b).

On peut donner une estimation asymptotique du côté gauche par la formule d’Euler-McLaurin.Par exemple, l’exercice 7.5 implique que

S(x) =∑n≤x

log n = x log x− x+O(log x).

On considère maintenant l’expression S(x)− 2S(x/2). D’un côté, on a que

S(x)− 2S(x/2) = x log x− x log(x/2) +O(log x) = x log 2 +O(log x).

Page 115: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

8.2. LES THÉORÈMES DE CHEBYSHEV ET DE MERTENS 115

D’autre côté, on a que

S(x)− 2S(x/2) =∑b≤x

ψ(x/b)−∑2b≤x

ψ(x/2b) =∑n≤x

(−1)n−1ψ(x/n).

La suite n→ ψ(x/n) est décroissante, donc par la théorie des séries alternées, on a que

ψ(x)− ψ(x/2) ≤ S(x)− 2S(x/2) ≤ ψ(x).

On trouve alors que ψ(x) ≥ x log 2 − O(log x) x pour x grand. Pour x petit, on observesimplement que ψ(x) ≥ ψ(2) = log 2.

Finalement, puisque

ψ(x)− ψ(x/2) ≤ x log 2 +O(log x) ≤ cx (x ≥ 1)

pour une constante absolue c > log 2, on déduit que

ψ(x) =∑

1≤2j≤x

[ψ(x/2j)− ψ(x/2j+1)] ≤∑

1≤2j≤x

cx

2j≤ 2cx.

Ceci conclut la démonstration.

Même si la méthode de démonstration du théorème 8.2 ne suffit pas pour obtenir laformule asymptotique π(x) ∼ x/ log x, on peut quand même donner des approximationspour quelques sommes de la forme

∑p≤x f(p), où f une fonction lisse que décroit rapidement

comme f(p) = log p/p et f(p) = 1/p. L’estimation de telles sommes est, en général, plusfacile car la location exacte d’un nombre premier donné est beaucoup moins importante (sonpoids est très petit). Voir aussi l’exercice 7.6.

Théorème 8.3. (a) Pour chaque x ≥ 1, on a que∑p≤x

log p

p= log x+O(1).

(b) Il existe une constante c ∈ R telle que∑p≤x

1

p= log log x+ c+O

(1

log x

)(x ≥ 2).

(c) Pour chaque x ≥ 2, on a que∏p≤x

(1− 1

p

)=

e−γ

log x

(1 +O

(1

log x

)).

Démonstration. (a) Le point de départ est encore l’identité log = Λ ∗ 1, d’où on trouve que∑n≤x

log n =∑ab≤x

Λ(a).

Page 116: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

116 CHAPITRE 8. LA CONVOLUTION DE DIRICHLET

Contrairement à la démonstration du théorème 8.2, maintenant on arrange la sommationcomme ∑

n≤x

log n =∑a≤x

Λ(a)∑b≤x/a

1.

La somme interne est égale à x/a+O(1). Par conséquent,∑n≤x

log n =∑a≤x

Λ(a) · (x/a+O(1)) = x∑a≤x

Λ(a)

a+O(ψ(x)) = x

∑a≤x

Λ(a)

a+O(x),

où on a utilisé le théorème 8.2.D’autre côté, comme on l’a vu ci-dessus, on a que

∑n≤x log n = x log x − x + O(log x).

Donc, ∑a≤x

Λ(a)

a= log x+O(1).

Puisque∑

a=pν , ν≥2 Λ(a)/a = O(1), la partie (a) du théorème découle tout de suite.

(b) Le résultat suit de la partie (a) et de sommation partielle. Plus précisément, si onécrit ∑

p≤x

log p

p= log x+R(x),

où R(x) = O(1), alors la relation (7.5) avec an = 1n est premierlognn

, f(n) = 1/ log n, etM(x) = log x implique que∑

p≤x

1

p= lim

ε→0+

∑2−ε<n≤x

anf(n) =∑

2−<n≤x

anf(n)

=

∫ x

2

1

t log tdt+

R(x)

log x− R(2−)

log 2+

∫ x

2

R(t)

t log2 tdt

= log log x− log log 2 +R(x)

log x− R(2−)

log 2+

∫ x

2

R(t)

t log2 tdt.

On observe que R(2−) = log 2 et que l’intégrale∫∞2R(t)/(t log2 t)dt converge absolument

car R(t) 1. Donc, si on pose c = − log log 2− 1 +∫∞2R(t)/(t log2 t)dt, on trouve que∑

p≤x

1

p= log log x+ c+O

(1

log x+

∫ ∞x

dt

t log2 t

)= log log x+ c+O

(1

log x

),

comme affirmé.

(c) On a que

εp := log

(1− 1

p

)+

1

p= −

∞∑m=2

1

mpm

d’après le développement de Taylor autour de 1 de la fonction logarithmique. Puisque∞∑m=2

1

mp2≤

∞∑m=2

1

2pm=

1

2p(p− 1)≤ 1

p2,

Page 117: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

8.2. LES THÉORÈMES DE CHEBYSHEV ET DE MERTENS 117

on déduit que εp = O(1/p2). Par la suite,

log∏p≤x

(1− 1

p

)= −

∑p≤x

1

p+∑p≤x

εp = − log log x+ c+∑p

εp +O

(1

log x+∑p>x

|εp|

)

= − log log x+ κ+O

(1

log x

),(8.7)

où κ := c+∑

p εp. Il reste à montrer que κ = −γ. Ceci est prouvé en utilisant des informationsconcernant le comportement analytique de la fonction zeta de Riemann autour de 1 (voirexercice ??).

Exercices

Exercice 8.9. Complete the proof of Theorem 8.2 by establishing the lower bound asfollows :(a) Show that

νp(n!) =∑j≥0

⌊n

pj

⌋,

where νp(m) is the p-adic valuation of m, that is to say the highest power of p thatdivides m.

(b) Show that b2xc − 2 bxc is a 1-periodic function taking only the values 0 and 1.(c) Conclude that (

2n

n

)≤ (2n)π(2n)

and complete the proof of Theorem 8.2.

Exercice 8.10. This exercise provides an alternative way to establish the lower boundin Theorem 8.2, due to Nair. Consider the integral In =

∫ 1

0xn(1 − x)ndx and the integer

N = lcm[n+ 1, n+ 2, . . . , 2n].(a) Prove that In ·N is a non-negative integer.(b) Prove that In ≤ 4−n.(c) Prove that N ≤ (2n)π(2n) and complete the proof of Theorem 8.2.

Exercice 8.11. Prove asymptotics for the sums∑p≤x

logk p

pand

∑p>x

1

p2

Exercice 8.12. Prove that the asymptotic π(x) ∼ x/ log x is equivalent to having that∑p≤x

log p

p= log x+ c+ o(1) (x→∞),

for some appropriate constant c.

Page 118: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

118 CHAPITRE 8. LA CONVOLUTION DE DIRICHLET

Exercice 8.13. Let p1 < p2 < · · · denote the sequence of primes, and let Pk = p1p2 · · · pk.(a) For k ≥ 2, show that pk k log k and that logPk k log k.(b) Assuming the Prime Number Theorem, show that pk ∼ k log k and logPk ∼ k log k as

k →∞.(c) Show that ω(n) log n/ log log n for all n. [Hint : what can you say about ω(n) if

n ≤ Pk ?](d) Show that

φ(n)

n∼

∏p|n

p≤logn

(1− 1

p

)≥

∏p≤logn

(1− 1

p

)(n→∞).

Page 119: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 9

La fonction zeta de Riemann

Les approches qu’on a vu dans le dernier chapitre pour compter les nombres premierss’appellent ‘élémentaires’ car ils utilisent des méthodes simples venant de la théorie desnombres et de l’analyse réelle. Cependant, la clé pour débarrer les sécrètes des nombrespremiers se trouve au plan complexe.

Souvent, afin de comprendre une suite an, on forme une série génératrice. L’exemple leplus familier est la série de puissances de an, définie par

S(z) =∞∑n=1

anzn.

Si |an| ≤ 1, alors cette série converge vers une fonction holomorphe dans le disque |z| < 1.De plus, si on peut évaluer S(z) (de façon exacte ou approximative), on peut aussi évaluerles coefficients an grâce à la formule d’inversion de Fourier

an =r−n

∫ 2π

0

S(reix)e−inxdx(9.1)

pour chaque r ∈ (0, 1). En effet, on a que∫ 2π

0

S(re2πix)e−2πinxdx =

∫ 2π

0

∞∑m=1

amrmei(m−n)xdx

=∞∑m=1

amrm

∫ 2π

0

ei(m−n)xdx

= 2πanrn,

car l’intégrale∫ 2π

0ei(m−n)xdx vaut zéro, sauf si m = n, dans quel cas il vaut 2π.

On va essayer d’appliquer l’approche décrite ci-dessus pour étudier les nombres premiers.Soit an la fonction indicatrice des premiers, dont la série de puissances est

Q(z) :=∑p

zp.

119

Page 120: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

120 CHAPITRE 9. LA FONCTION ZETA DE RIEMANN

En ajoutant (9.1) quand S(z) = Q(z), on déduit la formule d’inversion

π(N) =N∑n=1

r−n

∫ 2π

0

Q(reix)e−inxdx =1

∫ 2π

0

S(reix)1− (reix)−N

reix − 1dx(9.2)

pour chaque N ∈ Z≥1. On vois donc qu’une compréhension des propriétés analytiques deQ(z) peut nous amener à une estimation précise de π(N).

Cette approche arrive rapidement à un cul-de-sac, car ce n’est pas clair comment onpeut étudier la fonction Q(z) sans une connaissance profonde des premiers. En fait, la mêmeobjection peut être soulevée pour n’importe quelle fonction génératrice de la suite des pre-miers : comment est-ce que c’est possible de déterminer son comportement asymptotiquesans avoir déjà une bonne compréhension de la répartition des premiers ? Afin de répondreà cette question, on revient à la fonction Q(z) on l’analyse. Cette fonction est naturellementliée à la structure additive des premiers. Par exemple, on note que

Q(z)k =∑

p1,...,pk

zp1+···+pk =∞∑n=0

gk(n)zn,

où gk(n) est le nombre de façon d’écrire n comme la somme de k nombres premiers. Cepen-dant, les premiers sont d’objets multiplicatif, donc c’est plus naturel de les étudier d’un telpoint de vue. Pour le faire, on observe que la fonction logarithmique est un isomorphismede groupes de (R>0,×) à (R,+). Ceci nous amène naturellement à la considération de lafonction génératrice ∑

p

zlog p =∑p

plog z.

Ceci n’est plus une série de puissances, car les exposants ne sont pas d’entiers. En fait,c’est convenable de faire le changement de variables s = − log z, pour que notre fonctiongénératrice devient

P (s) :=∑p

1

ps.

En suivant la notation de Riemann, on écrit toujours

s = σ + it.

Cette nouvelle fonction génératrice est bien définie pour σ > 1 : on a que

|ns| = |nσ| · |nit| = nσ · |eit logn| = nσ

et on sait que∑

n 1/nσ converge si σ > 1. Donc P (s) converge absolument si σ > 1, ce quimontre notre affirmation.

Pour la k-ième puissance de P , on a que

P (s)k =∑p1

1

ps1· · ·∑pk

1

psk=∑

p1,...,pk

1

(p1 · · · pk)s=∞∑n=1

hk(n)

ns,

Page 121: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

121

où hk(n) dénote le nombre de manières d’écrire n comme le produit de k premiers. Enparticulier, hk est supportée sur les entiers ayant ≤ k facteurs premiers. En comparaison,avant on n’avait pas de contrôle sur le support de gk. On voit alors tout de suite que P (s)se comporte de meilleure façon que Q(z).

En poussant l’argument précédent, Euler a prouvé que la fonction P peut s’écrire entermes de la fonction zeta de Riemann

ζ(s) :=∞∑n=1

1

ns,

convergeant absolument aussi pour σ > 1. On observe que la fonction ζ est pour la suite desnombres naturels ce qui la fonction P est pour la suite des nombres premiers. L’importancede ζ dans l’étude des premiers se manifeste à l’identité suivante, connue comme le produitd’Euler de ζ :

ζ(s) =∏p

(1− 1

ps

)−1.(9.3)

Pour la montrer, on observe que

∏p

(1− 1

ps

)−1=∏p

(1 +

1

ps+

1

p2s+ · · ·

)=

(1

20s+

1

2s+

1

22s+ · · ·

)(1

30s+

1

3s+

1

32s+ · · ·

)(1

50s+

1

5s+

1

52s+ · · ·

)· · ·

Si on développe le produit infini, on trouve une série dont les sommés sont de la forme1/ns, où n est chaque produit possible de la forme 2v23v35v57v7 · · · avec vp ∈ Z≥0, et où lesexposants sont presque tous 0. Le théorème fondamental de l’arithmétique implique que lesn construits sont exactement tous les nombres naturels, d’où l’identité (9.3) suit.

En fait, l’argument ci-dessus a quelques trous, parce qu’on a ignoré plusieurs problèmesde convergence. Plus rigoureusement, si σ > 1 on sait que la série

∑n≥1 1/ns converge

absolument, donc on peut réarranger ses termes comme on veut. On a alors que

ζ(s) = limM→∞

limN→∞

∑pν‖n ⇒ p≤M, ν≤N

1

ns= lim

M→∞limN→∞

∏p≤M

(1 +

1

ps+

1

p2s+ · · ·+ 1

pNs

).

L’identité (9.3) est donc établie.

En prenant le logarithme de chaque côté de (9.3), on déduit que

log ζ(s) =∑p

∞∑ν=1

1

νpνs=∞∑ν=1

P (νs)

ν= P (s) +

∞∑ν=2

P (νs)

ν,(9.4)

qui fournit le lien entre P et ζ. Cette formule est le point de départ de la théorie analytiquedes nombres, puisque il connecte la fonction P , pour laquelle on ne savait rien, à la fonc-tion ζ. Cette dernière est significativement plus simple, puisque elle est définie comme une

Page 122: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

122 CHAPITRE 9. LA FONCTION ZETA DE RIEMANN

sommation sur tous les nombres naturels, qui sont un ensemble très régulier. Il semble alorspossible qu’on puisse obtenir des bonnes estimations de P (s).

Comme dans le cas de Q(z), on peut passer par P (s) à π(x). L’inversion se faite enutilisant la transformation de Fourier sur R et elle est donnée par l’identité

π(x+) + π(x−)

2=

1

∫ ∞−∞

P (σ + it)xσ+it

σ + itdt,(9.5)

valide pour chaque σ > 1 et chaque x ≥ 1. (Comme la valuer de l’intégrale impropre, onprend sa valeur principale, c’est-à-dire∫ ∞

−∞f(t)dt = lim

T→∞

∫ T

−Tf(t)dt.

Un calcul simple implique que le côté gauche de (9.5) est égal à π(x)− 1x is prime/2.En pratique, c’est un peu difficile de travailler avec P (s). On considère alors la série

∞∑n=1

Λ(n)

ns=∑p

∞∑m=1

log p

pms.

En dérivant la première égalité de (9.4), on trouve que

∞∑n=1

Λ(n)

ns= −ζ

ζ(s).

La formule analogue de (9.5) correspondant à cette série est

ψ(x+) + ψ(x−)

2=

1

∫ ∞−∞

(−ζ′

ζ

)(σ + it)

xσ+it

σ + itdt,(9.6)

valide pour chaque σ > 1 et chaque x ≥ 1.

Motivée par l’importance de ζ dans l’étude des nombres premiers, on l’étudie de plus. Enutilisant la formule d’Euler-McLaurin avec f(n) = 1/ns, on trouve que

ζ(s) = 1 + limN→∞

∑1<n≤N

1

ns

= 1 + limN→∞

(∫ N

1

dy

ys− y

ys

∣∣∣Ny=1− s

∫ N

1

yys+1

dy

)= 1 + lim

N→∞

(1−N−s+1

s− 1

∫ N

1

dy

ys− s

∫ N

1

yys+1

dy

)=

s

s− 1− s

∫ ∞1

yys+1

dy.(9.7)

L’expression dans (9.7) est bien définie quand σ > 0 : on a que |y/ys+1| ≤ 1/|ys+1| =1/yσ+1, et on sait que l’intégrale

∫∞1

1/ypdy converge quand p > 1. Donc la formule (9.7)

Page 123: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

123

nous donne une façon de prolonger la définition de ζ pour tous les nombres complexes avecσ > 0. En fait, on voit qu’on ne peut pas la définir en 1 (i.e. elle ‘explode’ vers l’infini à cepoint), car il faut diviser par 1 − 1 = 0 à ce point. La fonction ζ a une singularité en 1, cequi est une conséquence de la divergence de la série harmonique

∑∞n=1 1/n. Cette singularité

est très importante à l’étude de ψ(x) et de π(x) et elle en accord avec la conjecture deGauss (pour les connaisseurs d’analyse complexe, l’intégrante (−ζ ′/ζ)(s)xs/s dans (9.6) aune singularité de résidu x en 1).

Comme notre dernier remarque sur ζ, on observe que si ζ(ρ) = 0 dans un certain pointρ, la fonction ζ ′/ζ a une singularité en ρ. Par sa représentation (9.3), il suit que ζ(s) 6= 0quand σ > 1. On peut aussi montrer que les seuls zéros de ζ avec σ < 0 sont aux points−2,−4,−6, . . . . Tous les autres zéros se trouvent dans la bande s ∈ C : 0 ≤ σ ≤ 1, qu’onappelle la bande criticale. Riemann a conjecturé que tous les zéros de ζ dans cette bandese trouve sur la ligne centrale σ = 1/2. Ceci est la fameuse hypothèse de Riemann qui estencore ouverte et un des plus importants problèmes en mathématiques. Pour montrer lethéorème des nombres premiers, de la Vallée-Poussin et Hadamard on montré que ζ(s) 6= 0quand σ = 1. Après, de la Vallée-Poussin a amélioré ce résultat en prouvant qu’il existe uneconstante absolue c1 > 0 telle que

ζ(s) 6= 0 quand σ > 1− c1log(2 + |t|)

.(9.8)

Ceci a amené à une forme quantitative du théorème des nombres premiers :

π(x) = li(x) +O(xe−c2√log x) (x ≥ 2),(9.9)

où c2 > 0 est une autre constante absolue.On peut améliorer la qualité de l’estimation (9.11) si on agrandit la région san zéros

(9.10). Le record à ce moment-ci, montré par Korobov et Vinogradov en 1958, est que

ζ(s) 6= 0 quand σ > 1− c3

log2/3(2 + |t|)(log log(3 + |t|))1/3.(9.10)

Ceci a amené à une forme quantitative du théorème des nombres premiers :

π(x) = li(x) +O(xe−c4(log x)3/5/(log log x)1/5) (x ≥ 2),(9.11)

où c3 et c4 sont deux autres constantes absolues.

Exercices

Page 124: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

124 CHAPITRE 9. LA FONCTION ZETA DE RIEMANN

Page 125: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 10

Le théorème d’Erdős-Kac

Plusieurs problèmes dans la théorie analytique des nombres peuvent être rapprochéspar un perspectif probabiliste. Entre les plus beaux tels résultats se trouvent le théorèmed’Erdős-Kac qui concerne la distribution des valeurs de la fonction

ω(n) = #p|n.

On interprète ω comme une variable aléatoire sur l’ensemble n ≤ x, muni du mesure deprobabilité uniforme, c’est-à-dire

Pn≤x(A) :=|A|bxc

.

Notre but est de donner une estimation asymptotique à la probabilité

Pn≤x(ω(n) ∈ I)

quand x→∞, où I est un intervalle (qui peut dépendre de x).Afin d’approcher ce problème, on observe que si n ≤ x, alors

ω(n) =∑p≤x

1p|n.

Les fonctions Bp(n) := 1p|n sont des variables aléatoires de Bernoulli prenant les valeurs 0et 1. On a que

Pn≤x(Bp = 1) =#n ≤ x : p|n

bxc.

En posant n = mp, on trouve que #n ≤ x : p|n = #m ≤ x/p = bx/pc. Donc

Pn≤x(Bp = 1) =bx/pcbxc

=x/p+O(1)

x+O(1)=

1

p+O

(1

x

).

On a alors que

En≤x[Bp(n)] = 0 · Pn≤x(Bp = 0) + 1 · Pn≤x(Bp = 1) =1

p+O

(1

x

)∼x→∞

1

p,

125

Page 126: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

126 CHAPITRE 10. LE THÉORÈME D’ERDŐS-KAC

et que

Varn≤x[Bp(n)] = En≤x[Bp(n)2]− En≤x[Bp(n)]2 =1

p− 1

p2+O

(1

x

)∼x→∞

p− 1

p2.

On étudie maintenant les correlations entre les différentes variables Bp : si p1, . . . , pm sontde nombres premiers distincts, alors

Pn≤x(Bp1(n) = · · · = Bpm(n) = 1) =#n ≤ x : p1, . . . , pmpm|n

bxc=

#n ≤ x : p1 · · · pm|nbxc

=bx/(p1 · · · pm)c

bxc

=1

p1 · · · pm+O

(1

x

),

(10.1)

d’où

Pn≤x(Bp1(n) = · · · = Bpm(n) = 1) ∼m∏j=1

Pn≤x(Bpj(n) = 1) (x→∞).

On est amené alors à la conclusion que les variables aléatoires sont approximativementindépendantes l’une à l’autre. Sil elles étaient vraiment indépendantes, le théorème centrallimite impliquerait que leur somme ω(n) =

∑p≤xBp(n) tend vers la répartition normale avec

moyenne ∑p≤x

En≤x[Bp(n)] =∑p≤x

(1

p+O

(1

x

))= log log x+O(1)

et variation ∑p≤x

Varn≤x[Bp(n)] =∑p≤x

(1

p− 1

p2+O

(1

x

))= log log x+O(1),

où on a utilisé le théorème de Mertens (voir théorème 8.3(b)). Erdős et Kac ont montréen 1940 que la quasi-indépendance des variables Bp est suffisamment forte pour obtenir laconvergence de la répartition de ω à une variable normale :

Théorème 10.1 (Erdős-Kac). Soient α < β fixés. On a que

limx→∞

Pn≤x(

log log x+ α√

log log x ≤ ω(n) ≤ log log x+ β√

log log x)

=1√2π

∫ β

α

e−t2/2dt.

Démonstration. On suit un argument de Billingsley 1. Soit

µx =∑p≤x

1

p

1. Voir Section 30 du livre de P. Billingsley, Probability and measure, Third edition, Wiley Series inProbability and Mathematical Statistics. A Wiley-Interscience Publication. John Wiley & Sons, Inc., NewYork, 1995.

Page 127: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

127

et soit σx défini par

σ2x =

∑p≤x

(1

p− 1

p2

).

Puisque µx = log log x+O(1) et σx ∼√

log log x, il suffit de montrer que

Pn≤x(α <

ω(n)− µxσx

≤ β

)∼ 1√

∫ β

α

e−t2/2dt (x→∞).(10.2)

pour tous α < β. Un théorème probabiliste implique qu’il suffit de montrer que les momentsdes variables aléatoires normalisées (ω(n)−µx)/σx tendent vers les moments de la distributionnormale standard, c’est-à-dire que

En≤x

[(ω(n)− µx

σx

)k]∼ 1√

∫ ∞−∞

tke−t2/2dt (x→∞)(10.3)

pour chaque k ∈ N (considéré fixé quand x→∞).On considère maintenant les variables alèatoires de Bernoulli (Kp)p premier. On construit

les Kp de sorte qu’elles soient indépendantes l’une à l’autre, et qu’elles assument juste lesvaleurs 0 et 1 avec P(Kp = 1) = 1/p. On peut imaginer que les variables Kp sont des‘cousins’ des variables Bp qui la bonne propriété additionnelle de leur indépendance de l’uneà l’autre. Elles vivent dans un espace de probabilité ambient (dont la définition exacte n’estpas importante). Pour la somme de Kp alors le théorème central limite est un fait. Enparticulier, puisque ∑

p≤x

E[Kp] =∑p≤x

1

p= µx

et ∑p≤x

Var[Kp] =∑p≤x

(1

p− 1

p2

)= σ2

x,

on a que la suite des variables (∑

p≤xKp−µx)/σx converge en loi vers la distribution normalestandard quand x → ∞. En fait, la forme spécifique de cette suite nous permet d’établirque leurs moments aussi tendent vers les moments de la distribution normale standard,c’est-à-dire

E

[(∑p≤xKp − µx

σx

)k]∼ 1√

∫ ∞−∞

tke−t2/2dt (x→∞).

La discussion ci-dessus réduit (10.3) à démontrer que

En≤x

[(ω(n)− µx

σx

)k]∼ E

[(∑p≤xKp − µx

σx

)k](x→∞).

En multipliant les deux côtés par σkx, on voit qu’il suffit de prouver que

∆k := En≤x[(ω(n)− µx)k]− E

(∑p≤x

Kp − µx

)k = ox→∞((log log x)k).(10.4)

Page 128: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

128 CHAPITRE 10. LE THÉORÈME D’ERDŐS-KAC

On développe les k-ième puissances en utilisant le théorème du binôme : on a que

(ω(n)− µx)k =k∑j=0

(k

j

)ω(n)j(−µx)k−j.

La linéarité de l’espérance implique que

En≤x[(ω(n)− µx)k] =k∑j=0

(k

j

)(−µx)k−jEn≤x[ω(n)j].

De façon similaire, on a que

E

(∑p≤x

Kp − µx

)k =

k∑j=0

(k

j

)(−µx)k−jE

(∑p≤x

Kp

)j ,

d’où

∆k =k∑j=0

(k

j

)(−µx)k−j

En≤x[ω(n)j]− E

(∑p≤x

Kp

)j .

On a réduit donc (10.4) à démontrer que

δj := En≤x[ω(n)j]− E

(∑p≤x

Kp

)j = ox→∞((log log x)j)(10.5)

pour chaque nombre naturel fixé j.Afin de montrer (10.5), on développe les j-ièmes puissances : puisque ω =

∑p≤xBp, on

a queωj =

∑p1,...,pj≤x

Bp1 · · ·Bpj .

DoncEn≤x[ω(n)j] =

∑p1,...,pj≤x

En≤x[Bp1(n) · · ·Bpj(n)].

Puisque les variables aléatoires prennent juste les valeurs 0 et 1, on trouve que

En≤x[Bp1(n) · · ·Bpj(n)] = Pn≤x[Bp1(n) = · · · = Bpj(n) = 1].

On peut éliminer les premiers qui se répètent dans la liste p1, . . . , pj. Donc (10.1) impliqueque

En≤x[Bp1(n) · · ·Bpj(n)] =1

[p1, . . . , pj]+O

(1

x

),

d’où

En≤x[ω(n)j] =∑

p1,...,pj≤x

(1

[p1, . . . , pj]+O

(1

x

))=

∑p1,...,pj≤x

1

[p1, . . . , pj]+O

(π(x)j

x

).

Page 129: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

129

Le même argument implique que

E

(∑p≤x

Kp

)j =

∑p1,...,pj≤x

E[Kp1 · · ·Kpj ] =∑

p1,...,pj≤x

1

[p1, . . . , pj].

Par la suite,

δj π(x)j

x.

Le côté droit est trop grand en comparaison avec (log log x)j si j ≥ 2.On est arrivé alors à un impasse. Cependant, on peut utiliser une astuce pour le circum-

venter. On observe que si n ≤ x, alors #y < p ≤ x : p|n < log x/ log y. En effet, si p1, . . . , prsont les facteurs premiers > y de n, alors p1 · · · pr|n. En particulier, p1 · · · pr ≤ n ≤ x. D’autrecôté, p1 · · · pr > yr car pj > y pour chaque j. On conclut alors que yr < x, ce qui montrenotre affirmation que r ≤ log x/ log y.

On applique l’observation ci-dessus en prenant y = y(x) := x1/ log log log x. Si on pose

ω(n; y) = #p|n : p ≤ y,

on a que0 ≤ ω(n)− ω(n; y) ≤ log log log x,

ainsi que

0 ≤ µx − µy =∑y<p≤x

1

p= log

log x

log y+O(1) = log log log log x+O(1).

Alors, au lieu de monter (10.2), il suffit de montrer que

Pn≤x(α <

ω(n; y)− µyσy

)∼ 1√

∫ β

α

e−t2/2dt (x→∞).

En fait, comme on l’a discuté avant, il suffit de montrer que

En≤x

[(ω(n; y)− µx

σx

)k]∼ 1√

∫ ∞−∞

tke−t2/2dt (x→∞)

ou, de façon équivalent, on peut plutôt prouver que

En≤x

[(ω(n; y)− µx

σx

)k]∼ E

[(∑p≤yKp − µy

σy

)k](x→∞).

Comme avant, on réduit cette relation à l’estimation

En≤x[ω(n; y)j]− E

(∑p≤y

Kp

)j = ox→∞((log log x)j)(10.6)

Page 130: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

130 CHAPITRE 10. LE THÉORÈME D’ERDŐS-KAC

pour chaque nombre naturel fixé j. On a vu que

E

(∑p≤y

Kp

)j =

∑p1,...,pj≤y

1

[p1, . . . , pj].

De plus, on a que

En≤x[ω(n; y)j] = En≤x

(∑p≤y

Bp(n)

)j

=∑

p1,...,pj≤y

En≤x[Bp1(n) = · · · = Bpj(n) = 1]

=∑

p1,...,pj≤y

(1

[p1, . . . , pj]+O

(1

x

))

= E

(∑p≤y

Kp

)j+O

(π(y)j

x

).

Mais ici π(y) ≤ y = x1/ log log log x, donc l’erreur est miniscule. Ceci établit (10.6) et complètela démonstration du théorème.

Page 131: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Troisième partie

Méthodes transcendantales

131

Page 132: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons
Page 133: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 11

Nombres irrationnels et transcendantaux

Les anciens grecques considéraient les nombres d’une façon très géométrique, commelongueurs de lignes. Pythagore de Samos a fondé une association sécrète, appelée « les py-thagoriciens », qui est allée même plus loin. Les pythagoriciens ont développé une théoriedu cosmos qui se basait sur le principe d’analogies. En langue moderne, ils pensaient quetous les nombres constructibles à la règle et au compas sont analogues l’un de l’autre, c’est-à-dire ils sont de nombres rationnels. Cependant un membre des pythagoriciens, Hippasede Métaponte, a découvert un trou dans cette théorie. Considérons le triangle droite dontles cotés perpendiculaires ont longueur 1. Alors le théorème de Pythagore implique que sonhypoténuse a longueur

√2. Hippase a observé que

√2 est, contrairement à la croyance des

pythagoriciens, irrationnel ! L’argument est simple : si√

2 était rationnel, alors il existeraita, b ∈ N tels que (a, b) = 1 et

√2 = a/b. Donc b2 = 2a2, ce qui implique que 2|b2 et, par

la suite, que 2|b. Alors 4|b2 = 2a2, d’où on déduit que 2|a2, c’est-à-dire 2|a aussi. On estarrivé à une conclusion absurde : on a supposé que (a, b) = 1, et on montré que 2|a et que2|b. Par conséquent, notre hypothèse initiale, que

√2 ∈ Q, doit être fausse. Ceci conclut la

démonstration du fait que√

2 est un nombre irrationnel.

La découverte hérétique d’Hipasse lui a couté sa propre vie. Aujourd’hui, on sait que lesnombres irrationnels sont la grande majorité des nombres réels :

Théorème 11.1 (Cantor). L’ensemble des nombres réels est indénombrable. En particulier,les nombres irrationnels forment un ensemble indénombrable.

Démonstration. La démonstration, grâce à Cantor, utilise son fameux argument diagonal.On montrera que (0, 1] est indénombrable, qui est une déclaration plus forte. On considèreune suite des nombres a1, a2, . . . , an, . . . appartenants à (0, 1). On construira un nouveauélément de (0, 1] qui est diffèrent des a1, a2, . . . . Ceci suffit pour déduire notre affirmation.On construit ce nouveaux nombre comme suivant : pour chacun nombre, on considère sonexpansion décimale, soit ai = 0.ai1ai2 · · · ain · · · , où aij ∈ 0, 1, . . . , 9. On exige que ce soitune expansion infinie. (Pour tout nombre, il existe une unique telle expansion. Par exemple,si 0.5 appartient à notre suite, on considère son expansion infinie 0.4999 . . . ) On met dans

133

Page 134: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

134 CHAPITRE 11. NOMBRES IRRATIONNELS ET TRANSCENDANTAUX

une liste tous les nombres de la suite ann≥1 :

a1 = 0. a11 a12a13 · · · a1n · · ·

a2 = 0.a21 a22 a23 · · · a2n · · ·

a3 = 0.a31a32 a33 · · · a3n · · ·...

an = 0.an1an2an3 · · · ann · · ·...

On considère les chiffres de la diagonale, a11, a22, a33, . . . , avec lesquels on construit le nombreb ∈ (0, 1] dont l’expansion décimale b = 0.b1b2b3 · · · est donnée par

bi =

1 si aii 6= 1,

2 si aii = 1.

Donc l’expansion b = 0.b1b2 · · · est infinie. De plus, le i-ième chiffre décimal de cette expan-sion est different que le i-ième chiffre décimale du nombre ai. Alors b 6= ai, pour tout i ∈ N,comme voulu. Ceci conclut la démonstration.

Bien que les nombres irrationnels soient abondants, il est souvent assez difficile de montrerqu’un nombre donné est irrationnel. Ici on montre l’irrationalité d’un constant fameux, leconstant d’Euler e = 2.718 . . . , défini par e = limn→∞(1 + 1/n)n.

Théorème 11.2. Le nombre e est irrationnel.

Démonstration. On a l’expansion de la fonction x→ ex à sa série de Taylor

ex =∑n≥0

xn

n!.

Donce =

∑n≥0

1

n!.

C’est la clé pour finir la démonstration : on a exprimé e comme une série des nombres ration-nels qui converge très rapidement. Cette idée est centrale à plusieurs démonstrations qu’unnombre est irrationnel (ou, comme on verra à la section ??, qu’un nombre est transcendant).Supposons que e = a/b pour quelques a, b ∈ N. Donc le nombre

b! ·

(e−

b∑n=0

1

n!

)

Page 135: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

135

est entier. En effet, b!e = (b − 1)!a ∈ Z et b!∑b

n=1 1/n! =∑n

n=0 n!/b! ∈ Z car b!/n! =b(b− 1)(b− 2) · · · (n+ 1) ∈ Z pour tout n ∈ 0, 1, . . . , b. Cependant,

0 < b! ·

(e−

b∑n=0

1

n!

)= b!

∞∑n=b+1

1

n!=

∞∑n=b+1

1

(b+ 1)(b+ 2) · · ·n<

∞∑n=b+1

1

(b+ 1)n−b

=1

b+ 1· 1

1− 1/(b+ 1)

=1

b≤ 1.

C’est une contradiction : on a trouvé un nombre entier dans l’intervalle (0, 1), ce qui estimpossible.

Bien que la majorité de nombres réels soient irrationnels, pour nous c’est beaucoupplus simple de comprendre les nombres rationnels. Par exemple, les nombres rationnelsont une expansion décimale finie ou périodique. Pour cette raison, les mathématiciens ona essayé de trouver de bonnes approximations rationales des nombres irrationnels. Une fa-çon de le faire est de considérer l’expansion décimale d’un nombre irrationnel x, soit x =akak−1 · · · a0.b1b2 · · · . Puis on peut considérer les nombres rationnels xn = akak−1 · · · a0.b1b2 · · · bn,qui sont d’approximations de x. Mais comment est-ce qu’on peut mesurer la qualité d’uneapproximation rationale ? Supposons que a/b est une approximation rationale du nombreréel x. On voudrait que |x − a/b| est petit. En particulier, on voulait que |x − a/b| ≤ 1/b ;sinon, on peut trouver un autre nombre a′ ∈ Z tel que |x − a′/b| ≤ 1/b < |x − a/b|. Engénéral, on mesure la qualité de l’approximation rationale a/b en termes de la taille de sondénominateur b (en supposant que la fraction a/b est réduite, c’est-à-dire que (a, b) = 1). Lesapproximations xn du nombre x, construites au-dessus, ne sont pas si bonnes en général :si il existe un chiffre bm avec n < m ≤ n + C, pour un constant C petit (c’est-à-dire si lenombre x n’a pas un très longue lacune environ son n-ième chiffre, un événement rare), alorson a que

x− xn ≥bm

10m≥ 1

10n+C.

Mais si bn 6= 0 (ou si bm 6= 0 pour un m ∈ (n − C, n]), alors le dénominateur de la fractionxn est ≈ 10n, c’est-à-dire si on écrit xn = a/b, alors x−xn = x− a/b ≈ 1/b. C’implique que,en général, xn est une approximation faible à x.

Cependant, on peut construire d’approximations beaucoup mieux pour un nombre donnéx. Ils sont les fractions continus, dont la théorie on développera à la section 12. Pour lemoment, on montre le théorème suivant.

Théorème 11.3 (Théorème d’approximation de Dirichlet). Soient x ∈ R et Q ≥ 1. Alorsil existe une fraction réduite a/q telle que 1 ≤ q ≤ Q et∣∣∣∣x− a

q

∣∣∣∣ ≤ 1

qQ≤ 1

q2.

Démonstration. Sans perde de généralité, on peut supposer que Q ∈ N. On considéré lesQ+ 1 nombres x, 2α, . . . , (Q+ 1)α qui sont situés dans [0, 1). On partage [0, 1) dans

Page 136: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

136 CHAPITRE 11. NOMBRES IRRATIONNELS ET TRANSCENDANTAUX

les Q intervalles [(j − 1)/Q, j/Q), 1 ≤ j ≤ Q. Le principe des tiroirs implique que au moinsdeux nombres entre x, 2x, . . . , (Q+ 1)x, soient kx et `x avec 1 ≤ k < ` ≤ Q+ 1,appartient au même intervalle entre les moins deux de ces nombres sont situés au mêmeintervalle [(j − 1)/Q, j/Q), pour un j ∈ 1, . . . , Q. En particulier, on a que

|`x − kx| < 1

Q.

En posant m = bkxc et n = b`xc, on trouve que

|(`− k)x− (n−m)| < 1

Q⇒

∣∣∣∣x− n−m`− k

∣∣∣∣ < 1

(`− k)Q

Donc, si a/q est la fraction réduite de (m− n)/(`− k), on trouve que 1 ≤ q ≤ `− k ≤ Q etle théorème découle.

Jusqu’à ce point, on a examiné les nombres irrationnels et rationnels. Cependant, pas tousles nombres irrationnels ont la même complexité. Par exemple, le nombre

√2 est une des

racines de l’équation x2 − 2 = 0 et le nombre 51/3 satisfait l’équation algébrique x3 − 5 = 0.Il y a des exemples plus compliqués : par exemple, le nombre

√2 +√

3 est une des racinesdu polynôme

(x−√

2−√

3)(x−√

2 +√

3)(x+√

2−√

3)(x+√

2 +√

3)

= ((x−√

2)2 − 3)((x+√

2)2 − 3)

= (x2 − 1− 2√

2x)(x2 − 1 + 2√

2x)

= (x2 − 1)2 − 8x2 = x4 − 10x2 + 1.

Les nombres qui ont la même propriété, d’être une racine d’un polynôme dont les coefficientssont rationnels ont un nom spécial :

Définition 11.4. Un nombre complexe α est appelé algébrique si il existe un polynômef(x) ∈ Q[x] tel que f(α) = 0. Un nombre complexe qui n’est pas algébrique est appelétranscendant.

On peut donner un mesure de la complexité d’un nombre algébrique en utilisant le conceptdu degré :

Définition 11.5. Si α est un nombre algébrique, alors il existe un polynôme f(x) ∈ Q[x]de degré minimal tel que f(α) = 0. Le degré de ce polynôme est appelé le degré α et dénotépar deg(α).

La discussion au-dessous implique que les nombres√

2, 51/3 et√

2 +√

3 sont algébriques,de degré 2, 3 et 4, respectivement 1 D’autre côté, on sait que les nombres e et π sont denombres transcendants. Au théorème 11.7 on donnera un autre exemple concret d’un nombretranscendant. L’étape-clé est le résultat suivant, qui démontre que les nombres algébriquesne peuvent être très proche d’un nombre rationnel.

1. On peut montrer que si f(√2 +√3) = 0 pour un polynôme f(x) ∈ Q[x], alors nécessairement f(

√2−√

3) = f(−√2 +√3) = f(−

√2−√3) = 0. Donc deg(

√2 +√3) = 4.

Page 137: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

137

Théorème 11.6. Si α est un nombre réel algébrique de degré n ≥ 2, alors il existe unconstant c dépendant seulement de α tel que∣∣∣α− a

b

∣∣∣ ≥ c

bn,

pour tous a ∈ Z et b ∈ N.

Démonstration. Soit f(x) = anxn + an−1x

n−1 + · · ·+ a0 ∈ Q[x] tel que f(α) = 0. Soient a etb comme dans la déclaration du théorème. Le théorème de la valuer moyenne implique que

−f(ab

)= f(α)− f

(ab

)=(α− a

b

)f ′(t),

pour un t entre α et a/b. Donc si on donne un borne supérieure à |f ′(t)| et un borne inférieureà |f(a/b)|, on prendra un borne inférieure à |α − a/b|. Tout d’abord, on a que α 6= a/b carle degré de α est ≥ 2 et, par la suite, α /∈ Q. Aussi, il existe ε > 0 tel que l’intervalleeI := [α − ε, α + ε] n’a pas de racines de f(x) sauf α. Si a/b /∈ I, alors |a/b− α| ≥ ε ≥ ε/bn

et le théorème découle à condition que c ≤ ε. Finalement, supposons que a/b ∈ I et posonsM = supx∈I |f ′(x)|. Donc ∣∣∣α− a

b

∣∣∣ ≥ |f(a/b)|M

.

De plus, on a que

|f(a/b)| = |anan + an−1a

n−1b+ · · ·+ a1abn−1 + a0b

n|bn

≥ 1

bn

parce que le numérateur est un entier différent de 0 (rappelez que f(a/b) 6= 0 car la seuleracine de f appartenante à I est α et a/b 6= α). Le théorème découle en prennant c =minε, 1/M.

Théorème 11.7 (Liouville). Le nombre

x =∑n≥1

1

10n!= 0.110001000000000000000001 . . .

est transcendant.

Démonstration. On montrera que, à cause des grandes ensembles de zéros consécutifs, lenombre x est très proche à quelques nombres rationnels, trop proche pour être algébrique,selon le théorème 11.6. En effet, soit

xk =k∑

n=1

1

10n!

pour tout k ≥ 1, une suite des nombres rationnels qui approchent x lorsque k → ∞. On aque xk = ak/bk avec ak ∈ N et bk = 10k!. De plus,

0 ≤ x− xk =∑n=k+1

1

10n!≤ 1

10(k+1)!

∞∑n=k+1

1

10n−k−1=

1

9 · 10(k+1)!−1 =10

9bk+1k

.

Page 138: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

138 CHAPITRE 11. NOMBRES IRRATIONNELS ET TRANSCENDANTAUX

Alors x doit être transcendant. Sinon, il serait algébrique, soit de degré d. Selon le théorème11.6, ceci impliquerait que

|x− xk| ≥c

bdk,

pour un c > 0 qui est independent de bk. Alors il faudrait que

c

bdk≤ 10

9bk+1k

=⇒ bk+1−dk ≤ 10

9c.

C’est impossible car le côté droit de la dernière relation est non borné lorsque k →∞. Alorson conclut que x est transcendant, comme affirmé.

Exercices

Exercice 11.1. Soient n, k ∈ N avec k ≥ 2. Montrez que le nombre n1/k est rationnel si etseulement si n est une k-ième puissance parfaite.

Exercice 11.2. Est-ce que le nombre√

2 +√

3 est rationnel ou irrationnel ?

Page 139: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

Chapitre 12

Fractions continues

On développe ici la théorie des fractions continues qui donnent de très bonnes approxima-tions rationales aux nombres irrationnels. De plus, cette théorie se caractérise d’une grandeélégance, comme on le verra.

On commence avec l’approximation rationale d’un nombre la plus simple : la partie entier.En effet, si x ∈ R, alors x = bxc+ x, où bxc ∈ Z et x ∈ [0, 1). Donc, si on pose a1 = bxcet θ1 = x, alors a1 est une approximation rationale (en fait, entier !) de x et l’erreur decette approximation est égale à θ1 ∈ [0, 1). Puis, on observe que

x = a1 + θ1 = a1 +1

1/θ1.

Alors si on approxime 1/θ1 par sa partie entier, soit a2, et on met θ2 := 1/θ1, donc ontrouve que

x = a1 +1

a2 + θ2.

Le nombre rationnel a1 + 1/a2 serve comme une approximation de x. On continue commeavant : on inverse θ2 et on approxime son inverse, 1/θ2, par a2 := b1/θ2c. Si θ3 = 1/θ2,alors ceci nous amène à la relation

x = a1 +1

a2 +1

a3 + θ3

≈ a1 +1

a2 +1

a3

.

Le nombre rationnel au coté droit de cette relation est une autre approximation de x(meilleure que a1 et que a1 + 1/a2, comme on le verra).

Bien sûr, on peut continuer la procedure précédente indéfiniment. Alors on trouve desnombres a1 ∈ Z, a2, a3, · · · ∈ N et θ1, θ2, θ3, · · · ∈ [0, 1) tels que a1 = bxc, θ1 = x etan+1 = b1/θnc et θn+1 = b1/θnc, pour tout n ∈ N. (Si θN = 0 pour un N ∈ N, alors cetteprocedure termine après N étapes ; donc, les suites des θi et des ai sont, en fait, finies.) De

139

Page 140: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

140 CHAPITRE 12. FRACTIONS CONTINUES

plus, on a que

x = a1 +1

a2 +1

a3 +1

· · ·+ an−1 +1

an + θn

≈ a1 +1

a2 +1

a3 +1

· · ·+ an−1 +1

an

,

pour tout n ∈ N pour lequel les nombres a1, . . . , an et θ1, . . . , θn existent. Le nombre rationnelau coté droit de la relation au-dessus est appelé le n-ième convergent de x et il est dénotépar pn/qn (pour le moment, on ne précis pas la définition précise nombres pn et qn ; on lesexaminera plus soigneusement plus tard). Aussi, on a la définition suivante.

Définition 12.1. Étant donnés n nombres réels non-zéros a1, a2 . . . , an, on appelle la fractioncontinue de a1, . . . , an le nombre

[a1, . . . , an] := a1 +1

a2 +1

a3 +1

· · ·+1

an

.

De plus, étant donnée une suite infinie de nombres réels non-zéros a1, a2 . . . , on appelle lafraction continue de a1, a2, . . . le nombre

[a1, a2, . . . ] := limn→∞

[a1, . . . , an],

si le limite existe, au quel cas on dénote aussi par

[a1, a2, . . . ] = a1 +1

a2 +1

a3 + · · ·

.

Si x ∈ R et on définit les suites a1, a2, . . . et θ1, θ2, . . . comme au-dessus, alors on trouveque

x = [a1, a2, . . . , an−1, an + θn] et quepnqn

= [a1, a2, . . . , an].

La fraction continue (finie ou infinie) [a1, a2, . . . ], obtenue de cette procedure, est appeléela fraction continue de x. Ce n’est pas très difficile de montrer que la fraction continue d’unnombre est défini uniquement (voyez exercice 12.1).

On calcule les fractions continues de deux nombres concrets. Si x = 4113, alors on a que

x = 3 +2

13= 3 +

1

13/2= 3 +

1

6 +1

2

= [3, 6, 2].

Page 141: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

141

De même, si x = 10017

, alors on a que

x = 5 +15

17= 5 +

1

17/15= 5 +

1

1 +2

15

= 5 +1

1 +1

15/2

= 5 +1

1 +1

7 +1

2

= [5, 1, 7, 2].

On a vu dans les des exemples au-dessus que les fractions continues de 4113

et de 10017

sontfinies. Ce n’a pas été un accident :

Théorème 12.2. La fraction continue d’un nombre réel x est finie si et seulement si x estrationnel.

Démonstration. Si la fraction continue de x est finie, c’est evident que x est rationnel car ilexiste n ∈ N tel que x = [a1, . . . , an] ∈ Q.

Réciproquement, supposons que x ∈ Q. On écrit x = k/` avec k ∈ Z et ` ∈ N et (k, `) = 1.On observe que si a1 = bk/`c, alors

a1 ≤k

`< a1 + 1 =⇒ a1` ≤ k < a1`+ `.

Donc le nombre k − a1` est un des nombres 0, 1, . . . , ` − 1, c’est-à-dire k − a1` est le restedans la division de k par ` (et, par conséquent, a1 est le quotient de cette division). Si onpose r1 = k − a1`, alors

x =k

`=`a1 + r1

`= a1 +

r1`

= a1 +1

`/r1.

Si r1 = 0, on a finit. Sinon, on continue comme au-dessus : afin de trouver a2, on fait ladivision euclidienne de ` par r1 et on trouve a2 ∈ N et r2 ∈ 0, 1, . . . , r1 − 1 tels que` = a2r1 + r2. Donc `/r1 = a2 + r2/r1 et 0 ≤ r2/r1 < 1. Par la suite,

x = a1 +1

a2 +r2

r1

= a1 +1

a2 +1

r1/r2

.

Si r2 = 0, alors on a finit la démonstration. Sinon, on trouve a3 et r3 tels que r1 = a3r2 + r3et r3 ∈ 0, 1, . . . , r2 − 1. En continuant dans cette façon, après n étapes, on aura construitune suite r1, r2, . . . , rn, . . . telle que 0 ≤ rn < rn−1 < · · · < r1 < `, c’est-à-dire on a construitn nombres distincts appartenants à 0, 1, . . . , `. Ceci montre que cette procedure ne peutpas continuer infiniment. Plutôt, il existe un n ∈ 1, . . . , ` tel que rn = 0, ce qui impliqueque x = [a1, . . . , an], comme voulu.

Notre but maintenant est de comprendre la relation entre x et ses convergents pn/qn.Tout d’abord, on donne une définition précise de pn et de qn. Avant de donner la définitiongénérale, on définit quelques cas spéciaux pour des raisons pédagogiques : on a que la fraction

Page 142: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

142 CHAPITRE 12. FRACTIONS CONTINUES

continue d’un élément a1 est égale à [a1] = a1 = a1/1. Donc on définit p1 = a1 et q1 = 1.Puis, la fraction continue de a1 et de a2 est égale à

[a1, a2] = a1 +1

a2=a1a2 + 1

a2.

Donc on définit p2 = a1a2 + 1 et q2 = a2. De même, on a que

[a1, a2, a3] = a1 +1

a2 +1

a3

= a1 +a3

a2a3 + 1=a1(a2a3 + 1) + a3

a2a3 + 1,(12.1)

ce qui nous amène à poser p3 = a1(a2a3 + 1) + a2 et q3 = a2a3 + 1. En général, ce n’est pasdifficile de voir que

[a1, . . . , an] =Fn(a1, . . . , an)

Gn(a1, . . . , an)

pour quelques polynômes Fn et Gn. De plus, la relation

[a1, . . . , an] = a1 +1

[a2, . . . , an](12.2)

implique que

Fn(a1, . . . , an)

Gn(a1, . . . , an)= a1 +

1Fn−1

Gn−1(a2, . . . , an)

=a1Fn−1(a2, . . . , an) +Gn−1(a2, . . . , an)

Fn−1(a2, . . . , an).

Cette relation nous amène à la définition rigoureuse suivante.

Définition 12.3. On définit deux séquences de fonctions Fn : Rn → Rn≥1 et Gn : Rn →Rn≥1 inductivement par les relations F1(x1) = x1, G1(x1) = 1,

Fn(x1, . . . , xn) = x1Fn−1(x2, . . . , xn) +Gn−1(x2, . . . , xn)

etGn(x1, . . . , xn) = Fn−1(x2, . . . , xn).

Puis, étant donné une fraction continue [a1, . . . , an], on met pi = Fi(a1, . . . , ai) et qi =Gi(a1, . . . , ai), pour tout n ∈ 1, . . . , n. 1

La définition de Fn et de Gn implique tout de suite que

Fn(x1, . . . , xn)

Gn(x1, . . . , xn)= x1 +

1Fn−1

Gn−1(x2, . . . , xn)

.

1. On pourrait avoir donné une définition moins rigoureuse des polynômes Fn etGn : ils sont les polynômesqu’on obtient comme numérateur et dénominateur de la fraction [a1, . . . , an] après avoir fait toutes lessimplifications qu’on peut (sans diviser). Cependant, cette définition intuitive est plus difficile d’utiliser enpratique.

Page 143: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

143

En utilisant cette relation et la relation (12.2), on peut montrer inductivement que

pnqn

=Fn(a1, . . . , an)

Gn(a1, . . . , an)= [a1, . . . , an],

comme désiré.Les nombres pn et qn satisfassent de relations itératives simples. En effet, on observe que

p3 = a3p2 + p1 et que q3 = a3q2 + q1. On donne un dernière exemple : on a que

[a1, a2, a3, a4] = a1 +1

[a2, a3, a4]= a1 +

a4a3 + 1

a4(a2a3 + 1) + a2

=a1[a4(a2a3 + 1) + a2] + a4a3 + 1

a4(a2a3 + 1) + a2

=a4(a1(a2a3 + 1) + a3) + a1a2 + 1

a4(a2a3 + 1) + a2.

Par la suite, p4 = a4(a1(a2a3+1)+a3)+a1a2+1 = a4p3+p2 et q4 = a4(a2a3+1)+a2 = a4q3+q2.C’est un phénomène général :

Théorème 12.4. Pour tout n ≥ 1, on a que pn+2 = an+2pn+1 +pn et que qn+2 = an+2qn+2 +qn.

Démonstration. On utilise induction sur n. Quand n = 1, on a déjà vu que p3 = a3p2 + p1et que q3 = a3q2 + q1. Puis, on suppose que la conclusion du théorème est valide quandn ∈ 1, . . . , N − 1 et on la montre pour n = N aussi. L’hypothèse inductive et la définitionde Fn impliquent que

FN+2(a1, . . . , aN+2) = a1FN+1(a2, . . . , aN+2) +GN+1(a2, . . . , aN+2)

= a1[aN+2FN(a2, . . . , aN+1) + FN−1(a2, . . . , aN)]

+ [aN+2GN(a2, . . . , aN+1) +GN−1(a2, . . . , aN)]

= aN+2(a1FN(a2, . . . , aN+1) +GN(a2, . . . , aN+1))

+ a1FN−1(a2, . . . , aN) +GN−1(a2, . . . , aN)

= aN+2FN+1(a1, . . . , aN+1) +GN+1(a1, . . . , aN+1).

Donc pN+2 = aN+2pN+1 + pN , comme voulu. De même, on a que

GN+2(a1, . . . , aN+2) = FN+1(a2, ..., aN+2) = aN+2FN(a2, . . . , aN+1) + FN−1(a2, . . . , aN)

= aN+2GN+1(a1, . . . , aN+1) +GN(a1, . . . , aN).

Par la suite, on trouve aussi que qN+2 = aN+2qN+1+qN , ce qui conclut la démonstration.

Un corollaire directe du théorème précèdent est le résultat suivant.

Théorème 12.5. Pour tout n ≥ 1, on a que pn+1qn − pnqn+1 = (−1)n−1. En particulier, sia1, . . . , an ∈ Z, alors pn et qn sont d’entiers copremiers.

Page 144: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

144 CHAPITRE 12. FRACTIONS CONTINUES

Démonstration. On utilise induction sur n. Soit Dn = pn+1qn − pnqn+1. Si n = 1, alors on aque D1 = p2q1 − p1q2 = (a1a2 + 1) · 1 − a1a2 = 1. Puis, on assume que le résultat est vraipour n. On observe que

Dn+1 = det

(pn+2 pn+1

qn+2 qn+1

)= det

(an+2pn+1 + pn pn+1

an+2qn+1 + qn qn+1

)= det

(pn pn+1

qn qn+1

)(C1 → C1 − an+2C2)

= det

(pn+1 pnqn+1 qn

)(C1 ↔ C2)

= Dn,

ce qui conclut l’induction.

Armés avec ce théorème, on peut déduire plus d’informations pour la suite des convergentsd’un nombre.

Théorème 12.6. Soit x ∈ R et pn/qn la suite de ses convergents.

(a) On a que

p1q1<p3q3< · · · < p2n−1

q2n−1< · · · ≤ x ≤ · · · < p2n

q2n< · · · < p4

q4<p2q2.

(b) Pour tout n ∈ N, on a que ∣∣∣∣x− pnqn

∣∣∣∣ ≤ 1

qnqn+1

<1

q2n.

En particulier, limn→∞ pn/qn = x.

Démonstration. (a) Tout d’abord, on montre que

p2n−1q2n−1

≤ x ≤ p2nq2n

,(12.3)

pour tout n ∈ N. Puisque

piqi

= [a1, . . . , ai] et x = [a1, . . . , ai−1, ai + θi]

pour un θi ∈ [0, 1), alors il suffit de montrer que la fonction t → fi(t) := [a1, . . . , ai−1, t] estcroissante quand i est impair et décroissante quand i est pair. En effet, quand i = 1, on aque f1(t) = t, une fonction qui est évidemment croissante. La relation (12.3) découle pourtout i ≥ 1 de la formule

fi(t) = a1 +1

[a2, . . . , ai−1, t]

et d’induction sur i.

Page 145: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

145

Il reste de montrer que la suite p2n−1/q2n−1n≥1 est strictement croissante et que la suitep2n/q2nn≥1 est strictement décroissante. En effet, on que

pn+2

qn+2

− pnqn

=

(pn+2

qn+2

− pn+1

qn+1

)+

(pn+1

qn+1

− pnqn

)=

(−1)n

qn+1qn+2

+(−1)n−1

qnqn+1

=(−1)n−1(qn+2 − qn)

qnqn+1qn+2

,

ce qui termine la démonstration de la partie (a).

(b) Pour tout n, alors x est entre pn/qn et pn+1/qn+1, selon la relation (12.3). Donc∣∣∣∣x− pnqn

∣∣∣∣ ≤ ∣∣∣∣pn+1

qn+1

− pnqn

∣∣∣∣ =1

qnqn+1

<1

q2n,

ce qui conclut la démonstration.

Remarque 12.7. En général, si a1 ∈ Z et a2, a3, · · · ∈ N, alors la suite pnqn

= [a1, . . . , an]

converge : sa sous-suite p2n−1/q2n−1n≥1 est croissante et bornée au-dessus et, par la suite,elle est convergente. Soit x1 sa limite. De même, la sous-suite p2n/q2nn≥1 est décroissante etbornée en-dessous et, par la suite, elle est convergente. Soit x2 sa limite. Finalement, puisque

0 ≤ p2nq2n− p2n−1q2n−1

=1

q2n−1q2n→ 0 (n→∞),

alors x1 = x2. Donc le limite limn→∞ pn/qn existe.

Puis on montre que les fractions continues sont les meilleurs approximations rationalesdes nombres irrationnels.

Théorème 12.8. Si x ∈ R \Q, alors∣∣∣x− a

b

∣∣∣ > ∣∣∣∣x− pnqn

∣∣∣∣pour tout a, b ∈ Z tels que 1 ≤ b ≤ qn et a/b 6= pn/qn.

Démonstration. Supposons que n est pair ; le cas où il est impair est similaire.Tout d’abord, on montre le théorème dans le cas spécial où a/b = pn−1/qn−1. Puisque

pn−1qn−1

< x <pnqn,

une conséquence du théorème 12.6(a) et de notre hypothèse que n est pair, alors on a que|x− pn−1/qn−1| > |x− pn/qn| si et seulement la distance entre x et pn−1/qn−1 et plus grandque le moyen de la distance entre pn/qn et pn−1/qn−1. C’est-à-dire, il suffit de montrer que

x− pn−1qn−1

>1

2

∣∣∣∣pnqn − pn−1qn−1

∣∣∣∣ =1

2qn−1qn,

Page 146: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

146 CHAPITRE 12. FRACTIONS CONTINUES

où on a appliqué le théorème 12.5. On a que x > pn+1/qn+1 > pn−1/qn−1, par notre hypothèseque n est pair. Donc

x− pn−1qn−1

>pn+1

qn+1

− pn−1qn−1

=

(pn+1

qn+1

− pnqn

)+

(pnqn− pn−1qn−1

)= − 1

qnqn+1

+1

qn−1qn=qn+1 − qn−1qn−1qnqn+1

.

Alors, il suffit de montrer que

qn+1 − qn−1qn−1qnqn+1

>1

2qn−1qn⇔ qn+1 ≥ 2qn−1.

Mais on a que qn+1 = anqn + qn−1 ≥ qn + qn−1 > 2qn−1, ce qui montre le théorème dans lecas spécial où a/b = pn/qn.

Finalement, on considère le cas général. On a que∣∣∣∣ab − pnqn

∣∣∣∣ =|aqn − bpn|

bqn≥ 1

bqn≥ 1

bqn≥ 1

q2n,

car le numérateur est un entier non-zéro de notre hypothèse que a/b 6= pn/qn et, aussi, on asupposé que b ≤ qn.

On distingue deux sous-cas. Si a/b > x, on affirme que a/b > pn/qn ; sinon, on aurait quex < a/b < pn/qn et, par la suite,

pnqn− x ≥ pn

qn− a

b≥ 1

bqn≥ 1

q2n,

ce qui contredit théorème 12.6(b). Donc a/b > pn/qn, ce qui implique que∣∣∣x− a

b

∣∣∣ =a

b− x > pn

qn− x =

∣∣∣∣x− pnqn

∣∣∣∣ .Puis, on considère le cas où a/b < x. D

Donc si a/b > x. Dans ce cas, on affirme que a/b ≤ pn−1/qn−1 ; sinon, on aurait quepn−1/qn−1 < a/b < x. Par conséquent, on trouverait que

x− pn−1qn−1

≥ a

b− pn−1qn−1

=aqn−1 − bpn−1

bqn−1≥ 1

bqn−1≥ 1

qnqn−1,

car b ≤ qn, ce qui est impossible car

x− pn−1qn−1

<pnqn− pn−1qn−1

=1

qnqn−1.

Donc on a que a/b ≤ pn−1/qn−1 < x, ce qui implique que∣∣∣x− a

b

∣∣∣ ≥ ∣∣∣∣pn−1qn−1− x∣∣∣∣ > ∣∣∣∣x− pn

qn

∣∣∣∣ ,selon le cas où a/b = pn−1/qn−1 qu’on a déjà montré. Ceci conclut la démonstration duthéorème.

Page 147: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

147

Remarque 12.9. Le théorème 12.8 implique directement le théorème d’approximation deDirichlet. En effet, si p1/q1, p2/q2, . . . est la suite des convergents de x, alors il y a deux cas.Si qn ≤ Q pour tout n ≥ 1, alors x ∈ Q et x = b/r avec r ≤ Q, et le résultat découle tout desuite en posant a/q = b/r. Finalement, si il existe n ≥ 1 tel que qn > Q, on peut trouver mtel que qm ≤ Q < qm+1. Donc si on pose a/q = pm/qm, on a que∣∣∣∣x− a

q

∣∣∣∣ =

∣∣∣∣x− pmqm

∣∣∣∣ ≤ 1

qmqm+1

≤ 1

qmQ=

1

qQ,

ce qui est ce qu’il fallait montrer.

On conclut notre discussion des fractions continues avec une étude des fraction continuespériodiques. On commence avec le plus simple exemple : considérons le nombre

x = 1 +1

1 +1

1 +1

1 + . . .

.

On observe que x est un auto-similarité : on a que

x = 1 +1

x.

Donc x2 − x− 1 = 0, ce qui implique que x = (1±√

5)/2. Puisque x > 0, alors on conclutque x = (1 +

√5)/2.

Puis, on considère un autre exemple, un plus compliqué. Soit

x = 4 +1

1 +1

2 +1

3 +1

2 +1

3 + · · ·

.

On observe que

x = 4 +1

1 +1

y

,

y = 2 +1

3 +1

2 +1

3 + · · ·

.

Page 148: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

148 CHAPITRE 12. FRACTIONS CONTINUES

Maintenant on peu utiliser la même astuce : on a que

y = 2 +1

3 +1

y

= 2 +y

3y + 1=

7y + 2

3y + 1.

Donc 3y2 + y = 7y + 2 ou, de façon équivalente, 3y2 − 6y − 2 = 0. Alors on conclut quey = (3±

√15)/3. Puisque y > 0, on doit avoir que y = (3 +

√15)/3, d’où on déduit que

x = 4 +1

1 +3

3 +√

15

= 4 +3 +√

15

6 +√

15= 4 +

1−√

15

7=

29−√

15

7.

C’est un phénomène général :

Définition 12.10. Une fraction continue [a1, a2, . . . ] est appelée périodique si il existe k ≥ 1tel que an+k = an, pour tout n ≥ 1. Dans ce cas, on écrite

[a1, a2, . . . ] = [a1, . . . , ak].

Une fraction continue [a1, a2, . . . ] est appelée finalement périodique si il existe k ≥ 1 et` ≥ 1 tels que an+k = an, pour tout n ≥ `. Dans ce cas, on écrite

[a1, a2, . . . ] = [a1, . . . , a`−1, a`, . . . , ak+`−1].

Théorème 12.11. La fraction continue d’un nombre x est périodique si et seulement six = r +

√s pour quelques r, s ∈ Q avec s ≥ 0.

Démonstration. Sans perte de généralité, on suppose que x ∈ R \ Q ; sinon, on a que x =r +√s avec r = x et s = 0 et que la fraction de x est finie selon le théorème 12.2.

Supposons que x = [a1, . . . , a`−1, a`, . . . , ak+`−1] pour quelques k, ` ≥ 1. Donc

x = a1 +1

a2 +1

· · ·+1

a`−1 +1

y

,

où y = [a`, . . . , ak+`−1]. Alors on a que

y = a` +1

a`+1 +1

· · ·+1

ak+`−1 +1

y

= [a`, a`+1, . . . , ak+`−1, y].

Page 149: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

149

Soient pi/qi, 1 ≤ i ≤ k + 1, les convergents de la fraction continue [a`, a`+1, . . . , ak+`−1, y].On a que

y =pk+1

qk+1

=ypk + pk−1yqk + qk−1

selon le théorème 12.2. Donc

qky2 + qk−1y = pky + pk−1 =⇒ qky

2 + (qk−1 − pk)y − pk−1 = 0.

En appliquant la formule quadratique, on conclut que y = r′ +√s′ pour quelques r′, s′ ∈ Q

(nécessairement s′ ≥ 0 car on sait déjà que l’équation quadratique qky2+(qk−1−pk)y−pk−1 =0 a une solution réelle). Par conséquent, x doit être également de cette forme.

Réciproquement, supposons que x = r +√s pour quelques r, s ∈ Q avec s ≥ 0. Alors il

existe a, b, c ∈ Z tels que

ax2 + bx+ c = 0.(12.4)

On a que a 6= 0 ; sinon, on aurait que x ∈ Q. Mais on déjà traité le cas où x ∈ Q.Donc a 6= 0, comme affirmé. Soit x = [a1, a2, . . . ]. On veut montrer k et ` tels que x =[a1, . . . , a`−1, a`, . . . , ak+`−1]. On pose

xn = [an, an+1, . . . ]

et on observe qu’il suffit de trouver deux nombres différents n1 et n2 tels que xn1 = xn2 . (Sin1 < n2, ceci nous permettra de prendre ` = n1 et k = n2−n1.) Soient pn/qn les convergentsde x. On a que

x = [a1, . . . , an−1, xn]

et donc le théorème 12.2 implique que

x =xnpn−1 + pn−2xnqn−1 + qn−2

(n ≥ 3).(12.5)

(Notez que si p′i/q′i, 1 ≤ i ≤ n, sont les convergents de la fraction continue [a1, . . . , an−1, xn],alors p′i = pi et qi = q′i pour i ∈ 1, . . . , n − 1.) On utilisera cette relation pour montrerque xn satisfait une équation quadratique anx2 + bnx + cn = 0 également. Finalement, onmontrera que l’ensemble de ces équations quadratiques est, en fait fini. Puisque chaque cetteéquation a au plus deux racines, ceci nous permettra de montrer que l’ensemble xn : n ≥ 3et fini (et, par la suite, xn1 = xn2 pour quelques n1 et n2 qui sont différents).

Le théorème 12.5 implique que le determinant de la matrice(pn−1 pn−2qn−1 qn−2

)est ±1. En

général, soient α, β, γ, δ ∈ Z tels que

det

(α βγ δ

)= ε = ±1.

Six =

αy + β

γy + δ,

Page 150: Dimitris Koukoulopoulos Université de Montréal · 2017. 12. 18. · 10 CHAPITRE 1. LA STRUCTURE MULTIPLICATIVE DES ENTIERS Finalement, on montre l’unicité de qet r. Supposons

150 CHAPITRE 12. FRACTIONS CONTINUES

alors le nombre y est une racine de l’équation

a

(αy + β

γy + δ

)2

+ b

(αy + β

γy + δ

)+ c = 0,

puisque x est une racine de l’équation (12.4). En multipliant par (γy + δ)2 l’équation au-dessus, on peut l’écrire comme

Ay2 +By + C = 0,

A = aα2 + bαγ + cγ2, B = 2aαβ + b(αδ + βγ) + 2cγδ, C = aβ2 + bβδ + cδ2.

Quand (α βγ δ

)=

(pn−1 pn−2qn−1 qn−2

)pour un n ≥ 3, comme dans notre cas, on montrera que les nombres A,B et C sont bornésen termes de x, ce qui nous permettra de déduire qu’il y a seulement un nombre fini depossibilités pour les polynômes At2 +Bt+C. Tout d’abord, on note que si d = b2− 4ac et lediscriminant du polynôme ax2 + bx + c et D = B2 − 4AC est le discriminant du polynômeAx2 + Bx + C, alors on a que D = ε2d = d. Cette relation déjà impose de restrictions surA,B et C. De plus, si f(t) = at2 + bt+ c, alors on observe que

A = γ2f

γ

)= q2n−1f

(pn−1qn−1

)et C = δ2f

δ

)= q2n−2f

(pn−2qn−2

).

Mais f(x) = 0 par l’hypothèse et pi/qi → x lorsque i → ∞. Alors A et C ne peuventêtre très grands. En effet, si on écrit pi/qi = x + hi, alors le théorème 12.6(b) implique que|hi| < 1/(qiqi+1) ≤ 1. Donc, selon le théorème de la valuer moyenne, on trouve qu’il existeun ti ∈ (x− |hi|, x+ |hi|) ⊂ [x− 1, x+ 1] tel que

|f(x+ hi)| = |f(x) + hif′(ti)| = |hif ′(ti)| ≤

1

q2i·M,

où M = supx−1≤t≤x+1 |f ′(t)|. Par la suite,

|A| = q2n−1|f(x+ hn−1)| ≤M et |C| = q2n−2|f(x+ hn−2)| ≤M,

ce qui implique aussi que

|B| =√B2 =

√d+ 4AC ≤

√d+ 2

√|AC| ≤

√d+ 2M.

Par consequent, on trouve que, étant donné x, il y a seulement un nombre fini de possibilitéspour les nombres entiers A,B et C. Alors on déduit que l’ensemble xn : n ≥ 3 est fini,comme affirmé. Ceci conclut la démonstration.

Exercices

Exercice 12.1. Montrez que la fraction continue d’un nombre est uniquement définie.