CoursTopoMesure-2024

Cours au S5 du parcours Mathématiques et économie :
Topologie et Théorie de la mesure.
Yoann Dabrowski
7 octobre 2024
Table des matières
1 Ensembles dénombrables et Familles sommables 5

1 Ensembles (au plus) dénombrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1 Rappels sur les ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Ensembles innis dénombrables . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Ensembles innis non dénombrables . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Familles sommables à termes positifs . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1 Rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Dénition et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Sommation par paquet et applications . . . . . . . . . . . . . . . . . . . . . . 13
3 Familles sommables à termes scalaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Introduction à la Topologie des Espaces Métriques 17

1 Distance et Norme sur un espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Métriques équivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Boules dans un e.m. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.1 Parties bornées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4 Suites dans un e.m. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.1 Convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.2 Suite extraite, valeur d'adhérence . . . . . . . . . . . . . . . . . . . . . . . . . 20
5 Suite de Cauchy, Complétude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
5.1 Théorème de Point xe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6 Ouverts dans un em. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.1 Exemples d'ouverts et propriétés . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.2 Intérieur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7 Fermés dans un em. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7.1 Adhérence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
7.2 Densité, Frontière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
8 Fonctions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
8.1 Dénitions équivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
8.2 Homéomorphismes, Continuité uniforme, Lipschitzianité . . . . . . . . . . . . 27
8.3 Fonctions continues bornées . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
9 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
10 Propriétés particulières des evn de dimension nie. . . . . . . . . . . . . . . . . . . . 30
10.1 Complétude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
10.2 Applications linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
10.3 Équivalence des normes et conséquences. . . . . . . . . . . . . . . . . . . . . . 31
11 Compacité dans les e.m. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1
11.1 Complément : un résultat reliant complétude et compacité (facultatif ) . . . . . 34
11.2 Complément : Compacité topologique (facultatif ) . . . . . . . . . . . . . . . . 34
12 Intégrale de Riemann à valeur Espace de Banach . . . . . . . . . . . . . . . . . . . . 34
12.1 Rappel sur les Intégrales impropres . . . . . . . . . . . . . . . . . . . . . . . . 36
12.2 Exemples de référence (à connaître TRES BIEN) . . . . . . . . . . . . . . . . 36
12.3 Théorèmes de comparaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
13 Espaces métriques séparables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Ensembles et fonctions convexes, Introduction à l'optimisation 38

1 Ensembles Convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
n
1.1 Cônes tangents et normaux dans IR . . . . . . . . . . . . . . . . . . . . . . . 39
2 Fonctions convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.1 Calcul des cônes normaux courants . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2 Fonctions convexes sur IR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3 Propriétés diérentielles des fonctions convexes. . . . . . . . . . . . . . . . . . . . . . 44
3.1 Rappel sur la diérentiabilité (au sens de Fréchet) . . . . . . . . . . . . . . . . 44
3.2 Caractérisations diérentielles des fonctions convexes . . . . . . . . . . . . . . 44
3.3 Convexité, Critère d'extremum global . . . . . . . . . . . . . . . . . . . . . . . 46
4 Premières Inégalités de convexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4 Intégration de Lesbesgue : Construction de l'intégrale et grands théorèmes 49

0.1 Droite réelle étendue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
0.2 Limites inférieures et supérieures . . . . . . . . . . . . . . . . . . . . . . . . . 50
1 Tribus, fonctions mesurables et mesures . . . . . . . . . . . . . . . . . . . . . . . . . . 51
1.1 Tribus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
1.2 Mesure et Probabilité sur une tribu . . . . . . . . . . . . . . . . . . . . . . . . 52
1.3 Ensembles µ-négligeables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.4 Exemples de tribus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
1.5 Exemples de mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
1.6 Fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.7 Unicité des mesures σ -nies . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2 Les fonctions étagées (mesurables) et leur intégrale . . . . . . . . . . . . . . . . . . . 57
3 Intégrale des fonctions mesurables positives . . . . . . . . . . . . . . . . . . . . . . . . 59
3.1 Premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.2 Théorème de convergence monotone de Beppo Levi . . . . . . . . . . . . . . . 60
3.3 Lemme de Fatou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4 Intégrale des fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.1 Premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.2 Théorème de Convergence dominée de Lebesgue . . . . . . . . . . . . . . . . . 63
5 Théorème de transfert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6 Comparaison aux constructions de L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.1 Intégrale de Riemann des fonctions continues par morceau . . . . . . . . . . . 65
6.2 Mesures à densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.3 Lien avec les Séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7 Intégrales dépendant d'un paramètre . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
7.1 Un exemple : la transformée de Fourier d'une mesure avec moments d'ordre 2. 70
2
5 Intégration avancée : Théorème de Fubini, Changements de variables 71
1 Mesure produit et théorèmes de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . 71
1.1 Tribus produits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
1.2 Mesure produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
1.3 Théorème de Fubini-Tonelli et Fubini (admis) . . . . . . . . . . . . . . . . . . 73
2 Une Inégalité de convexité : l'Inégalité de Jensen . . . . . . . . . . . . . . . . . . . . . 74
3 Théorème de changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.1 Cas ane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2 Rappel (de L2) sur les diéomorphismes . . . . . . . . . . . . . . . . . . . . . 76
3.3 Cas général (admis) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6 Introduction aux espaces Lp 80

1 L'espace L∞ (Ω, µ) .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
p
2 Dénitions et propriétés élémentaires des espaces L (Ω, µ) . . . . . . . . . . . . . . . 81
2.1 Résultats de convergences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2 Résultats de densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
p
3 Cas discret : espaces ℓ (I), p ∈ [1, ∞[ (cf. TD) . . . . . . . . . . . . . . . . . . . . . . 86
7 Espaces de Hilbert ; bases hilbertiennes 88

1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2 Projection sur un convexe fermé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3 Applications : Orthogonalité et Dualité . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.1 Orthogonalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.2 Dualité : le théorème de représentation de Riesz . . . . . . . . . . . . . . . . . 93
4 Bases Hilbertiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.1 Procédé d'orthonormalisation de Gram-Schmidt . . . . . . . . . . . . . . . . . 94
4.2 Théorème des bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.3 Exemples de base 1 : Séries de Fourier . . . . . . . . . . . . . . . . . . . . . . 98
4.4 Exemple de base 2 : Polynômes d'Hermite . . . . . . . . . . . . . . . . . . . . 98
2
5 Une Application : Le théorème de convergence des martingales bornées dans L (Ω, T , P )
(facultatif ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
A Compléments facultatifs au chapitre 2 : Topologie des espaces métriques 102

1 Théorème de Tietze (niveau L3-M1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
2 Complément sur l'Espace dual (niveau début de M1) . . . . . . . . . . . . . . . . . . 104
3 Bidual, Complété (niveau début de M1) . . . . . . . . . . . . . . . . . . . . . . . . . 106
4 Compléments sur la compacité et complétude (niveau L2-L3) . . . . . . . . . . . . . . 107
5 Théorème d'approximation de Weierstrass (niveau L3-M1) . . . . . . . . . . . . . . . 107
6 Un résultat de compacité : le Théorème d'Ascoli (niveau L3 Math) . . . . . . . . . . . 108
B Compléments facultatifs et hors programme au chapitre 3 : Ensembles et fonctions

convexes 110
n
1 Propriétés des Cônes tangents et normaux dans IR . . . . . . . . . . . . . . . . . . . 110
2 Enveloppe convexe, cônes tangents et cônes normaux pour tout e.v.n. E (Niveau L3) 112
3 Points selles (Niveau L2-L3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4 Jauge de Minkowski d'un ensemble convexe (Niveau M1) . . . . . . . . . . . . . . . . 116
5 Séparation des convexes (Niveau M1) . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3
C Compléments facultatifs au chapitre 4 : Espaces mesurés. 121
1 Lemme de classe monotone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
1.1 Dénitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
1.2 Le résultat principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
1.3 Preuve du corollaire 4.19 au lemme de classe monotone sur l'unicité des mesures
sigma-nie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
2 Compléments sur les Boréliens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
2.1 Espaces métriques séparables et leurs boréliens . . . . . . . . . . . . . . . . . . 123
2.2 Compléments : Théorème d'approximation de Weierstrass . . . . . . . . . . . . 125
2.3 Preuve du lemme 4.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
3 Stabilité des fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4 Compléments sur la construction de l'intégrale . . . . . . . . . . . . . . . . . . . . . . 126
4.1 Intégrale des fonctions étagées . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.2 Preuve du lemme 4.20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.3 Preuve du lemme 4.22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
D Compléments facultatifs et hors programme au chapitre 6 : Espaces Lp 129

1 Formule alternative de la norme (niveau L3) . . . . . . . . . . . . . . . . . . . . . . . 129
2 Premiers résultats de densité (niveau M1) . . . . . . . . . . . . . . . . . . . . . . . . 130
p
3 Dualité des espaces de Lebesgue L (Ω) (Niveau M1) . . . . . . . . . . . . . . . . . . . 133
4 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5 Support de la convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6 Régularisation par convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7 Suites régularisantes et densité par convolution . . . . . . . . . . . . . . . . . . . . . . 138
E Compléments facultatifs et hors programme au chapitre 7 139

1 Rappel sur le lemme de Zorn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
2 Théorème des bases dans le cas général . . . . . . . . . . . . . . . . . . . . . . . . . . 139
3 Correction de l'exercice sur les polynômes de Hermite . . . . . . . . . . . . . . . . . . 141
4 Théorème d'injectivité de la transformée de Fourier . . . . . . . . . . . . . . . . . . . 142
4.1 Sommes de variables aléatoires indépendantes (Rappels) . . . . . . . . . . . . 143
4.2 Preuve [Facultative] du Thm d'injectivité de la transformée de Fourier . . . . 144
5 Théorème de Radon-Nikodym et Théorème de Dunford-Pettis (Niveau M1-M2) . . . . 146
4
Chapitre 1
Ensembles dénombrables et Familles
sommables
Un espace de probabilité discret (disons dénombrable) associe des nombres, les probabilités aux
évènements de base {ωi }, correspondant aux éléments ωi de l'espace des réalisations et en sommant
à des évènements plus compliqués. Comme ces nombres vont être associés à des ensembles, l'ordre
de sommation de ces nombres ne doit pas importer. On va donc étudier une notion de sommation de
série où l'ordre de sommation n'importe pas. Le but est donc pour une famille de nombres (ui )i∈I ,
indicée par un ensemble inni I (le plus souvent dénombrable) de dénir la somme :
X
ui ,
i∈I
en conservant les propriétés de commutativité et d'associativité des sommes nies.

Même dans le cas I = IN, le but est d'obtenir une notion de sommation qui ne privilégie pas les
sous-ensembles nis [[0, n]] comme la notion de somme de série usuelle. On verra que dans ce cas,
cette notion de sommation coïncide avec la convergence absolue que vous connaissez déjà.
Le but de la Théorie de la mesure sera d'étendre cette construction à des espaces dits mesurés
(de probabilité ou de masse totale diérente de 1), incluant les espaces probabilités continues. Le
principe de la construction sera le même et généralisera le cas plus simple de ce chapitre.
1 Ensembles (au plus) dénombrables

1.1 Rappels sur les ensembles
Dénition 1.1. La fonction indicatrice d'une partie A est l'application 1A : Ω → {0; 1} dénie par
1A (ω) = 1 si ω∈A et 1A (ω) = 0 si ω ̸∈ A.
On a admis en L1 l'existence de l'ensemble IN des entiers naturels et d'un ensemble constitué des
parties de Ω (ce sont des axiomes de base de la théorie des ensembles).
Dénition 1.2. L'ensemble des parties de Ω est noté P(Ω). Une famille F de parties de Ω est une
partie de P(Ω) (soit F ⊂ P(Ω) ou F ∈ P(P(Ω)). Les éléments de F sont des parties de Ω.
Lemme 1.1. La fonction indicatrice A 7→ 1 réalise une bijection entre P(Ω) et {0, 1} (l'ensemble Ω
des applications de Ω dans {0, 1}).

A
5
Démonstration. L'inverse est h 7→ h−1 ({1}). La vérication que c'est bien un inverse est facile, et
laissée en exercice.
Rappel .1.1 Si A et B sont deux parties de Ω (i.e. deux éléments de P(Ω)).

1. On a les relations A⊂B ou B⊂A ou (A ̸⊂ B et B ̸⊂ A). A ⊂ B s'écrit aussi B ⊃ A.
2. On a déni en L1 : A×B (a, b) a ∈ A, b ∈ B , l'intersection A ∩ B
l'ensemble des couples
(ensemble des éléments à la fois dans A et dans B ), l'union A ∪ B (ensemble des éléments à la
fois dans A ou dans B ), le complémentaire de B dans A :A − B = A ∩ B = {x ∈ A : x ̸∈ B}
c
et la diérence symétrique A∆B = (A − B) ∪ (B − A). On remarquera la relation de ces

opérations avec les connecteurs logiques de base.
3. Plus généralement on dénit l'union d'une famille Ai ∈ P(Ω), i ∈ I :

[
Ai = {x ∈ Ω : ∃i ∈ I : x ∈ Ai },
i∈I
et de l'intersection d'une même famille :

\
Ai = {x ∈ Ω : ∀i ∈ I : x ∈ Ai }.
i∈I
qui vérie les relations de distributivités :

[ [
Ai ∩ C = (Ai ∩ C)
i∈I i∈I
\ \
Ai ∪ C = (Ai ∪ C)
i∈I i∈I
et plus généralement [ [ [
Ai ∩ Cj = (Ai ∩ Cj ).
i∈I j∈J i∈I,j∈J
\ \ \
Ai ∪ Cj = (Ai ∪ Cj ).
i∈I j∈J i∈I,j∈J
4. A et B sont disjoints si A ∩ B = ∅.
5. On a les relations fondamentales du complémentaire (Ac )c = A et pour le complémentaire des
unions [ c \
Ai = Aci
i∈I i∈I
et (de façon équivalente) des intersections :

\ c [
Ai = Aci .
i∈I i∈I
Rappel .1.2 Soit A⊂E et f : Ω → E, on rappelle que l'image réciproque f −1 (A) est dénie par :
f −1 (A) = {ω ∈ Ω : f (ω) ∈ A}.
On a vu en L1 les relations
f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B),
6
f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B),
f −1 (Ac ) = [f −1 (A)]c ,
[ [
f −1 Ai = f −1 (Ai ), (1.1)
i∈I i∈I
\ \
−1
f Ai = f −1 (Ai ).
i∈I i∈I
Un ensemble A qui n'est pas ni est dit inni.
1.2 Ensembles innis dénombrables

Dénition 1.3. dénombrable f : A →
au plus dénombrable
Un ensemble inni A est s'il existe une bijection IN. Un
ensemble A est s'il existe une injection f : A → IN.
Remarque . 1.3 Certains auteurs disent dénombrable pour ce que nous appelons au plus dénombrable
et inni dénombrable avec le sens de dénombrable ci-dessus.
On va utiliser librement le lemme suivant :
Lemme 1.2. 1. Toute partie non-vide de IN a un minimum.

2. Une application strictement croissante f : IN → IN (resp. f : [[0, n]] → IN) vérie f (p) ≥ p
pour tout p dans son domaine.
Démonstration. P 1. Si n
est non-vide et donc, disons, contient [[0, n]] ∩ P , alors est aussi non-vide
et FINI, donc a clairement un minimum. 2. Il sut de voir le deuxième cas (en restreignant aux
segments initiaux), on le montre par récurrence sur n. Si n = 0 , f (0) ∈ IN donc c'est évident. En
supposant l'hypothèse vraie au rang n, on considère f : [[0, n + 1]] → IN, la restriction à [[0, n]] vérie
l'hypothèse de récurrence, donc f (p) ≥ p pour p ≤ n et f (n + 1) > f (n) ≥ n mais dans IN cela
implique f (n + 1) ≥ n + 1 et conclut l'étape d'induction.
On peut représenter les éléments d'un ensemble dénombrable A à l'aide d'une suite innie en
écrivant A = {xn ; n ≥ 1} (x est l'inverse de la bijection f ).
Proposition 1.3. Les ensembles au plus dénombrables sont soit nis, soit dénombrables. De plus,
pour une partie innie P ⊂ IN, il existe une bijection strictement croissante et une seule de IN → P .
Démonstration. Les ensembles au plus dénombrables sont par dénition en bijection avec les parties
de IN. Dans le cas inni, il sut de voir le second point pour obtenir la bijection avec IN. On dénit
∗
par récurrence la bijection f : IN → P . Plus précisément, on construit par récurrence sur n une
application strictement croissante fn : [[1, n]] → P telle que pour tout x ∈ Im(fn ), y ∈ P − Im(fn ),
x < y et fn |[[1,k]] = fk . Comme P , inni, il est non-vide donc admet un élément a0 = min(P ) On pose
f0 (0) = a0 d'où l'initialisation.
On suppose construit fn , et on prend an+1 = min(P − Im(fn )) qui existe car cette partie est
innie de IN donc non vide (si elle n'était pas innie, P serait nie comme union nie de parties
nies). On pose fn+1 (k) = fn (k), k ≤ n, fn+1 (n + 1) = an+1 de sorte que par l'hyp de rec sur fn ,
an+1 > fn (k), k ≤ n ce qui donne la stricte croissance de fn+1 en combinant avec celle de fn . Enn,
si y ∈ P − Im(fn+1 ) ⊂ P − Im(fn ) on a par hyp de rec y > fn (k)k ≤ n et y > an+1 car c'est le min
donc ≥ et on a y ̸= an+1 par construction. Donc la relation demandée à l'étape suivante est vériée.
7
On obtient f strictement croissante donc injective en rassemblant les valeurs des fn qui s'accordent
(f (n) = fn (n) = fm (n), m ≥ n).
Pour voir que f bijective, par l'absurde, sinon il existe b ∈ P − Im(f ) mais par stricte croissance
d'entiers f (n) → ∞ donc il existe n minimal tel que b < f (n) = fn (n) ce qui impose par minimalité
b > f (n − 1) et contredit fn (n) = M in(P − Im(fn−1 )) vu b ∈ P − Im(fn−1 ).
−1
Pour l'unicité, si g est une autre telle bijection g ◦ f est une bijection strictement croissante de
−1
IN → IN ainsi que sa réciproque et le lemme 1.2 donne donc g ◦ f (n) ≥ n, f −1 ◦ g(n) ≥ n et donc,
d'où par croissance de g, f appliquée encore à ces relations : f = g .
Proposition 1.4. Un ensemble P est au plus dénombrable si et seulement si il existe un surjection

f:IN → P.
Démonstration. Pour l'implication directe, si P est dénombrable, la bijection de la dénition convient,
si P est ni, en bijection avec [[0, n − 1]] alors le reste modulo n donne la surjection IN → [[0, n − 1]]
qui composée à la bijection donne la surjection cherchée. Réciproquement, l'ensemble f −1 (p), p ∈ P
est une partie de IN qui a un plus petit element ap : a : P → IN est l'injection cherchée.
On va obtenir des exemples d'ensembles dénombrables les plus courants. Pour cela on a besoin
de quelques méthodes de constructions.
Lemme 1.5. 1. La réunion d'une suite (X ) d'ensembles nis 2 à 2 disjoints est au plus
dénombrable.
n n≥0
2. Un ensemble X est au plus dénombrable si et seulement si il admet une de

parties nies, c'est à dire une suite croissante de parties nies dont l'union est X .
suite exhaustive
3. Le produit cartésien d'un nombre ni d'ensembles au plus dénombrables est au plus dénom-
brable.
Démonstration. a = Card(X )
1. Soit n A =n
P
et
n
a A = 0
k=0 k ( −1
n
∗
h :
). On a des bijections n
[[An−1 + 1, An ]] → [[1, an ]] → Xn qui induisent une application h : IN → ∪n Xn dès qu'un nombre
inni de Xi n'est pas vide, ou h : [[1, Ap ]] → ∪n Xn qui est par construction surjective. L'injectivité
des hn et le fait que les Xn sont disjoints donne l'injectivité de h. 2. Si X est ni on prend la suite
constante, sinon, pour une bijection h : IN → X on prend Xn = h([[0, n]]) comme suite croissante
cherchée. Réciproquement, la suite croissante Xn donne une suite disjointe X0 , Xn+1 − Xn de parties
nies, donc 1 donne que l'union est au plus dénombrable.
3. Une récurrence triviale ramène au cas du produit de 2 ensembles A, B . Soit h : IN → A,
2
g : IN → Bdes surjections données par la proposition 1.4. f = h × g : IN → A × B est une surjection
2 2
qui ramène au cas IN qui admet pour suite exhaustive d'ensembles nis [[0, n]] .
Proposition 1.6. Les ensembles IN , k ∈ IN ; ZZ et Ql sont innis dénombrables.

k ∗
Démonstration. k
On a vu le cas du produit IN au lemme précédent. [[−n, n]] est une suite exhaustive
d'ensemble ni pour ZZ qui est donc au plus dénombrable par la proposition précédente, il est inni
∗
car il contient IN. Enn (p, q) 7→ p/q est une surjection de ZZ × IN → Q,
l donc par la proposition 1.4
Q
l est au plus dénombrable, et inni car contient IN.
Enn, on améliore le lemme précédent.
Proposition 1.7. Une réunion au plus dénombrable d'ensembles au plus dénombrables est au plus
dénombrable.
8
Démonstration. Soit (Xn )n≥0 une suite d'ensembles dénombrables (si la suite est nie, on peut la
prolonger en une suite innie. Petite subtilité, passé d'une famille dénombrable à une suite d'ensemble
n'est pas complètement anodin et utilise l'axiome du choix dénombrable). Soit fn : IN → Xn une
2 S
surjection donnée par la proposition 1.4. On pose f : IN → Xn déni par f (n, p) = fn (p) et en
n∈IN
2
composant avec une surjection IN → IN , on obtient le résultat par la réciproque dans la proposition
juste citée.
Les ensembles au plus dénombrables serviront de base aux probabilités discrètes.
1.3 Ensembles innis non dénombrables

Les ensembles qui n'appartiennent pas aux catégories précédentes (nis ou innis dénombrables)
sont dits innis non dénombrables. On va voir que par exemple, IR et C,
l [a, b], a < b sont innis non
dénombrables.
Le résultat clef est toujours un argument diagonal :
Lemme 1.8. (Théorème de Cantor) Il n'existe pas de surjection h : E → P(E) entre un ensemble
E et l'ensemble de ses parties.
Démonstration. h : E → P(E)
En eet une application A = {x ∈
permet de considérer l'ensemble
E : x ̸∈ h(x)}. Il n'existe pas de y tel que h(y) = A car par l'absurde, si il existait, soit y ∈ A et
alors y ̸∈ h(y) = A une contradiction, soit y ̸∈ A et alors y ∈ h(y) = A encore une contradiction.
Remarque . 1.4 En conséquence de ce lemme et de la proposition 1.4, P(IN) n'est pas dénombrable
(il est inni à cause de l'injection x 7→ {x} déni sur IN), car sinon on aurait une surjection de
IN → P(IN). En conséquence {0, 1}IN , en bijection avec la fonction indicatrice n'est pas non-plus
dénombrable.
Théorème 1.9. [0, 1] et IR ne sont pas dénombrables.

En conséquence un intervalle quelconque [a, b], en bijection avec [0, 1] ne l'est pas non plus. et
un intervalle quelconque contenant au moins deux points (qui contient donc aussi un [a, b]) est aussi
non-dénombrable.
Démonstration. On construit une injection φ : {0, 1}IN → [0, 1] (le cas IR s'en déduit. (l'image de
cette injection va être l'ensemble triadique de Cantor). On xe a = (an ) ∈ {0, 1}IN on dénit une
suite de segments emboîtés, on pose J0 = [0, 1] et si Jn = [xn , yn ] alors on découpe l'intervalle en
trois en posant un = (2xn + yn )/3 et vn = (xn + 2yn )/3. Si an = 0, on pose Jn+1 = [xn , un ], et si
an = 1, on pose Jn+1 = [vn , yn ]. On obtient par construction une suite de segments emboîtés, xn , yn
n
sont des suites adjacentes et yn − xn ≤ 1/3 (récurrence facile) donc l'intersection est un singleton
∩n Jn = {φ(a)}.
′
Pour voir que φ est injective on note que si a ̸= a sont deux suites et n le premier indice avec
an ̸= a′n , alors Jn ∩ Jn′ = ∅ et les images sont donc distinctes.
Remarque . 1.5 L'ensemble triadique de Cantor a plein de propriétés intéressantes. Topologiquement,
il est fermé, totalement disconnecté (les composantes connexes sont les singletons). Il est de longueur
nulle (car inclus dans l'union sur tous les cas possibles des Jn dont la longueur perd un facteur 2/3
à chaque n). Le sens de cette longueur sera vu au chapitre 3 (c'est la mesure de Lebesgue). Il est
en fait fractal de dimension de Hausdor ln(2)/ ln(3) < 1 (ce qui réexplique la longueur nulle, mais
c'est un sujet beaucoup plus avancé des mesures intermédiaires entre discret et continue).
9
Exemple . 1.1 L'ensemble des nombres irrationnels IR −Q
l est non-dénombrable, car sinon son union
avec Q
l à savoir IR serait dénombrable, ce qui n'est pas le cas.
2 Familles sommables à termes positifs

2.1 Rappels
Rappel . 1.6 La somme x+y avec x, y ∈ IR, est dénie à l'exception du cas où x = ±∞ et y = −x.
Contrairement au cas des limites, on pose 0. + ∞ = 0, t. + ∞ = +∞ pour t > 0.
Pour un ensemble A non-vide (non-nécessairement borné), on utilise sup A pour le plus petit
majorant M ∈ IR deA et inf A pour le plus grand minorant m ∈ IR de A.
On utilisera aussi inf ∅ = +∞, sup ∅ = −∞.
Si (ai )i=1,...,n est une suite nie (disons de nombres complexes) et σ : [[1, n]] → [[1, n]] une bijection.
La propriété de commutativité de la somme donne :
n
X n
X
ai = aσ(i) .
i=1 i=1
Démonstration. En voyant σ comme produit de transpositions, il sut de montrer le résultat pour

σ = (jk) une transposition avec j < k.
Mais par commutativité (a + b = b + a) et associativité ((a + b) + c = a + (b + c)) de la somme :
n j−1 k−1 n j−1 k−1 n n

X X X X X X X X
aσ(i) = aσ(i) +aσ(j) + aσ(i) +aσ(k) + aσ(i) = ai +ak + ai +aj + ai = ai .
i=1 i=1 i=j+1 i=k+1 i=1 i=j+1 i=k+1 i=1
Corollaire 1.10. Si E est ni et e : [[1, n]] → E une bijection, f : E → Cl alors P n

f (ei ) ne dépend
pas de la bijection e. On note X X n
i=1
f (e) = f (ei ).
e∈E i=1
Démonstration.
′
Si on prend une autre bijection e′ on considère la bijection σ = e−1 ◦ e′ de sorte que
e◦σ =e. La formule de commutativité de la somme conclut :
n
X n
X n
X
f (ei ) = f (eσ(i) ) = f (e′i ).
i=1 i=1 i=1
Le résultat suivant résume les propriétés de manipulation de ces sommes :
Proposition 1.11. 1. Si E ni, on a

X
Card(E) = 1.
e∈E
10
2. (Sommation par paquet) Si E ni est une union disjointe nie E = S Ei (c'est à dire I
ni et E ∩ E = ∅ si i ̸= j) et f : E → Cl alors :
i j
i∈I
X XX
f (e) = f (e).
e∈E i∈I e∈Ei
En particulier, on a Card(E) = P Card(E ).

3. (interversion de sommes nies) Si E, F sont nis et a : E × F → C,l alors :
i∈I i
XX X XX
ae,f = ae,f = ae,f .
e∈E f ∈F (e,f )∈E×F f ∈F e∈E
En particulier, on a Card(E × F ) = Card(E)Card(F ).

Démonstration.
P P n
Card(E) = n E = {e , ..., e }
1. Si , 1 n pour une bijection e : [[1, n]] → E , on a donc
e∈E 1 = i=1 1 = n par dénition.

Pi
2. On pose j : [[1, m]] → I une bijection et ni = Card(Ej(i) ) On note N0 = 0, Ni = l=1 nl .
On a Ni − Ni−1 = ni , i ≥ 1 donc on a une bijection (en composant la soustraction de Ni−1 :
[[Ni−1 + 1, Ni ]] → [[1, ni ]] avec la bijection donnée par la dénition du cardinal [[1, ni ]] → Ej(i) , gi :
[[Ni−1 + 1, Ni ]] → Ej(i) . On pose g(k) = gi (k), si k ∈ [[Ni−1 + 1, Ni ]]. Montrons que g réalise une
bijection de [[1, Nm ]] → E. En eet, par hypothèse, E est l'union des Ej(i) , dont tous les éléments
sont atteints par gi , donc par g qui est donc surjective. De plus, si g(k) = g(l) ∈ Ei , comme l'union
décrivant E est disjointe, on a k, l ∈ [[Ni−1 + 1, Ni ]] et gi (k) = gi (l) et comme gi est injective, on
déduit k = l et donc comme k, l sont arbitraires, on déduit que g est aussi injective.
Donc par dénition de la somme sur un ensemble (au début et aux deux dernières lignes) :
X Nm
X
f (e) = f (g(k))
e∈E k=1
N1
X N2
X Nm
X
= f (g(k)) + f (g(k)) + · · · + f (g(k))
k=1 k=N1 +1 k=Nm−1 +1
m
X Nl
X
= f (g(k))
l=1 k=Nl−1 +1
m
X Nl
X
= f (gl (k))
l=1 k=Nl−1 +1
m
X X
= f (e)
l=1 e∈Ej(l)
XX
= f (e)
i∈I e∈Ei
Le résultat sur le cardinal est une application du 1. et de la sommation par paquet pour la fonction
f =1 constante :
X XX X
Card(E) = 1= 1= Card(Ei ).
e∈E i∈I e∈Ei i∈I
11
3. Il sut d'appliquer la sommation par paquet aux unions disjointes
E × F = ∪e∈E {e} × F = ∪f ∈F E × {f }.
Pour le cardinal on a par le 1 et la distributivité de la multiplication par rapport à l'addition :
X XX X X
Card(E × F ) = 1= 1= Card(F ) = Card(F ) 1 = Card(E)Card(F ).
(e,f )∈E×F e∈E f ∈F e∈E e∈E
2.2 Dénition et premières propriétés

Dénition 1.4. Une famille (ai )i∈I de nombres réels positifs est dite sommable si
( )
X
sup aj : J ⊂ I, fini <∞
j∈J
et alors on note ( )
X X
ai = sup aj : J ⊂ I, fini .
i∈I j∈J
Tout d'abord, le résultat simple suivant ramène au cas I dénombrable, ce que l'on supposera par
la suite :
Lemme 1.12. Si (a ) est une famille sommable, alors le support I = {i ∈ I : ai ̸= 0} est au plus
dénombrable.
i i∈I 0
Démonstration. En eet si S =
P
i∈I ai et si In = {i ∈ I : ai ≥ S/n}, alors I0 = ∪n≥1 In est
au plus dénombrable comme union d'une suite d'ensembles nis car Card(In ) ≤ n. En eet, si
P
j ∈ In , aj ≥ S/n donc si J ⊂ In ni S ≥ j∈Jn aj ≥ SCard(J)/n donc Card(J) ≤ n et donc
Card(In ) ≤ n.
On résume les propriétés générales dans l'énoncé suivant :
Proposition 1.13. 1. (critère des suites exhaustives) Si (J ) est une suite exhaustive de
parties nies de I , alors la famille (a ) est sommable si et seulement si la suite (P a )
n n≥0
est bornée et alors on a X

i i∈I i∈Jn i n≥0
X X
IN
a = sup a = lim a.
i i i
n→∞
i∈I n∈ i∈Jn i∈Jn
2. (lemmePde domination) Si a ≤ b pour tout i et (b ) sommable, alors (a ) est sommable et

alors a ≤ P b .
i i i i i∈I
3. (lemme de permutation) Si (a ) est sommable et σ : I → I est une bijection, alors (a )

i∈I i i∈I i
est sommable de même somme.

i i∈I σ(i) i∈I
Démonstration. 1/ La famille
P
a
i∈Jn i étant inclus dans la famille des sommes nies, il est clair
qu'elle est majorée si la famille est sommable (et on a en passant au sup la partie ≥ de l'égalité
énoncée). Mais réciproquement toute famille nie est inclus dans un certain Jn , par dénition d'une
suite exhaustive, d'où la borne inverse et la réciproque.
P P
2/ Il sut de borner les sommes partielles nies
P ai
i∈JP ≤ bi P
i∈Jet passer au sup.
3/ Pour tout J ni, σ(J) est ni donc i∈J aσ(i) = i∈σ(J) ai ≤ i∈I ai . D'où la sommabilité
−1
et la première inégalité en passant au sup. En considérant la bijection réciproque σ on obtient de
même l'autre inégalité.
12
Le dernier résultat généralise la commutativité des sommes.
Corollaire 1.14. Une famille à termes positifs (a ) IN est sommable si et seulement si la série
n n∈
est convergente.
∞
X
an
n=0
2.3 Sommation par paquet et applications

On conclut avec les deux résultats importants, le premier généralise l'associativité des sommes
nies. On rappelle qu'une partition (Iλ )λ∈Λ de I est une famille d'ensembles 2 à 2 disjoints d'union
égale à I.
Théorème 1.15. (de sommation par paquets) Soit (I ) une partition de I . Une famille (a )
est sommable si et seulement si on a à la fois les deux propriétés suivantes :
λ λ∈Λ i i∈I
1. pour chaque λ ∈ Λ, (a ) est sommable, disons de somme σ

2. et (σ ) est sommable.
i i∈Iλ λ
Dans tous les cas (même en l'absence de sommabilité), on a l'égalité :

λ λ∈Λ
!
X X X X
ai = σλ ≡ ai .
i∈I λ∈Λ λ∈Λ i∈Iλ
Démonstration. Commençons par la condition nécessaire. Si (ai )i∈I est sommable alors les sommes
nies d'une sous famille (ai )i∈Iλ sont
Pbornées par les sommes de la famille totale donc on a la première
condition de sommabilité et σλ ≤ i∈I ai . Plus si on a des sous ensembles nis J1 ⊂ Iλ1 , ..., Jn ⊂ Iλn
n
pour des λj distincts, ils sont disjoints et leur union J = ∪k=1 Jk est un sous-ensemble ni de I donc
n X
X X X
ai = ai ≤ ai
k=1 i∈Jk i∈J i∈I
Donc en passant successivement au sup sur les Jk ni, on obtient :
n
X X
σλk ≤ ai .
k=1 i∈I
Donc la famille (σλ )λ∈Λ est sommable et on obtient la première inégalité ≥ en passant au sup.
Réciproquement, pour tout J partie nie de I on dénit Jλ = J ∩ Iλ et on obtient un nombre ni
n
de λ tel que J = ∪k=1 Jλk . On déduit
X n X
X n
X X
ai = ai ≤ σλk ≤ σλ .
i∈J k=1 i∈Jk k=1 λ∈Λ
D'où la bornitude sur J qui donne la sommabilité, et l'autre inégalité en passant au sup.
Un cas particulier est la "version famille sommable" du théorème de Fubini (qui se généralise à
un théorème d'intégration). Le cas positif est nommé théorème de Fubini-Tonelli. Il correspond à la
décomposition
I × J = ∪i∈I {i} × J = ∪j∈J I × {j}.
Il donne un résultat d'interversion des sommes.
13
Théorème 1.16. (de Fubini-Tonelli) Une famille double (a ) à termes positifs est sommable
si et seulement si on a l'une des deux propriétés équivalentes suivantes :P
i,j i∈I,j∈J
1. pour tout i ∈ I , (a ) est sommable et la famille des sommes ( P a ) est sommable

2. pour tout j ∈ J , (a ) est sommable et la famille des sommes ( a ) est sommable
i,j j∈J j∈J i,j i∈I
Dans tous les cas (même en l'absence de sommabilité), on a l'égalité :

i,j i∈I i∈I i,j j∈J
! !
X X X X X
ai,j = ai,j = ai,j .
(i,j)∈I×J i∈I j∈J j∈J i∈I
Démonstration. C'est une application directe du résultat de sommation par paquets avec les parti-
tions ci-dessus.
Exemple .
∞ X
∞
X 1
1.2 Calculons la somme I= .
i=0 j=0
(i + j + 1)2
Comme c'est une série à coecient positifs, chaque somme est somme d'une famille sommable,
donc par Fubini-Tonelli, on obtient une somme sur le produit :
X X 1 X 1
I= = .
(i + j + 1)2 2
(i + j + 1)2
i∈IN j∈IN (i,j)∈IN
Comme chaque terme de la somme ne dépend que de n = i + j + 1, on a envie de considérer la

2 2
partition de IN = ∪ ∗Λ
n avec Λn = {(i, j) ∈ IN : i + j + 1 = n}. Par le théorème de sommation
n∈IN
par paquet, on a :
∞
X X 1
I= .
n=1 (i,j)∈Λn
(i + j + 1)2
X 1
Il sut donc de calculer Mais Λn est ni de taille n vu Λn = {(i, n − 1 − i) : 0 ≤
(i + j + 1)2
(i,j)∈Λn
X 1 Card(Λn ) 1
i ≤ n − 1} ≃ [[0, n − 1]], donc
2
= 2
= . C'est le terme d'une série de
(i + j + 1) n n
(i,j)∈Λn
Riemann divergente, donc I = +∞ et les familles ne sont pas sommables.
3 Familles sommables à termes scalaires

Comme pour les séries, on se ramène au cas à valeur positif en prenant le module. On pourrait
n
traiter de façon semblable le cas à valeurs vectorielles (par exemple dans IR ou dans ce qu'on appelera
au chapitre suivant un e.v.n. où toute suite de Cauchy converge, un e.v.n dit complet) en prenant la
norme à la place du module. On note IK = IR ou IK =C
l le corps de référence.
Dénition 1.5. (zi )i∈I de nombres complexes ou réels est dite sommable si la famille
Une famille
1
(|zi |)i∈I est sommable. On note ℓ (I, IK) l'ensemble des familles sommables d'éléments de IK indexées
par I .
On note X
||z||1 = |zi |.
i∈I
14
Lemme 1.17. ℓ1 (I, IK) est un espace vectoriel et de plus on a pour u, v ∈ ℓ1 (I, IK), µ, ν ∈ IK :
||λu + µv||1 ≤ |λ|||u||1 + |µ|||v||1 .
Démonstration. I
On voit que c'est un sous-espace vectoriel de l'ensemble des fonctions IK . D'abord,
la famille nulle est sommable et de plus si λ, µ ∈ IK, (ai ), (bi ) des familles sommables, pour J ni, on
a par l'inégalité triangulaire (des nombres) :
X X X X
|λai + µbi | ≤ |λ||ai | + |µ||bi | = |λ| |ai | + |µ| |bi | ≤ |λ|||a||1 + |µ|||b||1
i∈J i∈J i∈J i∈J
1
donc comme la valeur est bornée, on obtient, la sommabilité de la famille donc ℓ (I, IK) (λai + µbi ),
I
est stable par combinaison linéaire et est donc un sous-espace vectoriel de IK , puisqu'il contient aussi
la famille nulle (0).
De plus en passant au sup sur J on obtient ||λa + µb||1 ≤ |λ|||a||1 + |µ|||b||1 .
Comme d'habitude pour dénir l'intégrale (ici on va dénir de même la somme), on sépare les
parties positives, négatives des parties réelles et imaginaires, pour dénir la somme. On note donc
(ai )+ = max(ai , 0), (ai )− = max(−ai , 0) de sorte que zj = (Re zj )+ − (Re zj )− + i(Im zj )+ − i(Im zj )−
Comme (Re zj )+ + (Re zj )− , (Im zj )+ + (Im zj )− ≤ |zj | on déduit que si (zj ) est sommable, alors
((Re zj )+ ), ((Re zj )− , ((Im zj )+ ), ((Im zj )− ) le sont aussi par domination.
Dénition 1.6. La somme d'une famille sommable (zi )i∈I est la valeur :
X X X X X
zj := (Re zj )+ − (Re zj )− + i (Im zj )+ − i (Im zj )− .
j∈I j∈I j∈I j∈I j∈I
Exercice .
1.1 Vérier que la somme d'une famille sommable est une application linéaire. (indication :
considérer une suite exhaustive de parties nies pour se ramener au cas des sommes nies).
On a le résultat qui résume les propriétés élémentaires :
Proposition 1.18. 1. Une famille (z ) est sommable si et seulement si (Re z ) et (Im z )

sont sommables.
i i∈I i i∈I i i∈I
2. (z ) est sommable si et seulement si (z ) est sommable et on a :

i i∈I i i∈I
X X
zj = zj ,
j∈I j∈I
3. Pour (z ) sommable, on a l'inégalité triangulaire généralisée :

i i∈I
X X
zj ≤ |zj |.
j∈I j∈I
4. (lemme de permutation) Si (z ) est sommable etPσ : I → I est une bijection, alors (z )

est sommable de même somme. EnPparticulier, si a est une série absolument convergente
i i∈I σ(i) i∈I
et σ une permutation de IN alors a est absolument convergente de même somme.

n
σ(n)
15
Démonstration. 1/ Les bornes | Re zp
i | ≤ |zi | et | Im zi | ≤ |zi | donnent la condition nécessaire par
domination. Réciproquement |zi | = | Re zi |2 + | Im zi |2 ≤ | Re zi | + | Im zi | et comme ℓ1 est un e.v,
on a vu que l'hypothèse implique (| Re zi | + | Im zi |)i∈I sommable d'où le résultat à nouveau par
domination.
2/ l'équivalence est évidente en utilisant 2 fois le 1. L'égalité vient directement de la dénition.
3/ On xe une suite exhaustive Jn de I. D'après le critère des suites exhaustives pour les
P P P
quatre séries à termes positives intervenant dans la somme,
P j∈I zj = limn→∞ j∈Jn zj , j∈I |zj | =
limn→∞ j∈Jn |zj | donc par l'inégalité triangulaire pour les sommes nies (et continuité du module)
X X X X X
zj = lim zj = lim zj ≤ lim |zj | = |zj |.
n→∞ n→∞ n→∞
j∈I j∈Jn j∈Jn j∈Jn j∈I
4/ Tout vient du cas positif, soit par la dénition de sommabilité soit par la dénition de la
somme en terme de somme de familles à termes positifs. Le cas particulier vient du fait que si la
famille est indicée par IN, le critère des suites exhaustives (appliqué à la suite [[0, n]]) implique qu'être
sommable équivaut à être absolument convergente.
Remarque . 1.7 Une série telle que

P
an telle que pour tout σ permutation de IN on ait
P
aσ(n) conver-
geant est dite inconditionnellement convergente. Un résultat classique qu'on trouve par exemple dans
Bourbaki Topologie Générale III.44 dit qu'une série numérique inconditionnellement convergente est
absolument convergente. Il n'y a donc pas d'extension possible du dernier énoncé.
On nit avec les résultats de sommation par paquets et de Fubini. Dans les deux cas, on n'a plus
d'équivalence comme dans le cas à terme positif. On utilise alors souvent/toujours le cas à terme
positif pour montrer la sommabilité nécessaire à appliquer le cas avec signe/complexe.
Théorème 1.19. (de sommation par paquetss) Soit (I ) une partition de I . Si une famille (z )
est sommable alors on a les deux propriétés suivantes :
λ λ∈Λ i i∈I
1. pour chaque λ ∈ Λ, (z ) est sommable, disons de somme σ

i i∈Iλ λ
De plus, on a l'égalité :
λ λ∈Λ
!
X X X X
zi = σλ ≡ zi .
Démonstration.
Comme (|zi |)i∈I , la sommabilité de (|zi |)i∈Iλ vient du cas positif. De plus, par l'in-
P P
i∈Iλ zi | ≤
égalité triangulaire des familles sommables ( proposition 1.18), i∈Iλ |zi | et le théorème |
de sommation par paquets assure la sommabilité du membre de droite, donc par comparaison, celle
de (σλ )λ∈Λ comme voulu. L'égalité vient du cas positif appliqué aux parties positives et négatives des
parties réelle et imaginaire.
En appliquant la sommation par paquets à la même partition que dans le cas positif, on obtient :
Théorème 1.20. (de Fubini) Si une famille double (z ) est sommable alors on a les deux
propriétés suivantes :
i,j i∈I,j∈J
1. pour tout i ∈ I , (z ) est sommable et la famille des sommes (PP z ) est sommable
2. pour tout j ∈ J , (z ) est sommable et la famille des sommes ( z ) est sommable
i,j j∈J j∈J i,j i∈I
i,j i∈I i∈I i,j j∈J
! !
X X X X X
zi,j = zi,j = zi,j .
(i,j)∈I×J i∈I j∈J j∈J i∈I
16
Chapitre 2
Introduction à la Topologie des Espaces
Métriques
Dans tout le cours, IK = IR, (le corps des nombres réels) ou C

l (le corps des nombres complexes).
|λ| est la valeur absolue ou le module de λ ∈ IK.
1 Distance et Norme sur un espace vectoriel

Dénition 2.1. X un ensemble (en général supposé non-vide).
Soit Une distance sur X est une
application d : X × X → [0, +∞[ telle que :
i ∀x, y ∈ X, d(x, y) = d(y, x) (symétrie)
ii ∀x, y, z ∈ X d(x, z) ≤ d(x, y) + d(y, z) (inégalité triangulaire ou sous-additivité)
iii ∀x, y ∈ X d(x, y) = 0 ⇐⇒ x = y (séparation)
Un couple (X, d) est appelé espace métrique (em).
Dénition 2.2. E un IK-e.v. Une norme sur E est une application n : E → [0, +∞[ telle que :
Soit
i ∀x ∈ E, λ ∈ IK n(λx) = |λ|n(x) (homogénéité)
ii ∀x, y ∈ E n(x + y) ≤ n(x) + n(y) (inégalité triangulaire ou sous-additivité)
iii ∀x ∈ E n(x) = 0 ⇐⇒ x = 0 (séparation)
Souvent on note n(x) = ||x||, sauf dans l'exemple E = IK, n(x) = |x|. Un couple (E, ||.||) est appelé
espace vectoriel normé (evn).
Exemple . 2.1 Soit X ⊂E une partie (non-vide) avec d(x, y) = ||x − y||, alors (X, d) est un espace
métrique et tout espace métrique est de cette forme.
Exemple . 2.2 Si E = IRn on a trois normes classiques, si X = (x1 , ..., xn ) :
n
X
||X||1 = |xi |
i=1
v
u n
uX
||X||2 = t |xi |2 (norme euclidienne)
i=1
||X||∞ = max |xi |

i=1...n
Exercice . 2.1 Montrer que ce sont des normes (cf. TD de L2).
17
Exemple .2.3 Si E = C 0 ([a, b], IR) l'ensemble des fonctions continues sur [a, b], on a trois normes :
Z b
||f ||1 = |f (t)|dt
a
s
Z b
||f ||2 = |f (t)|2 dt
a
||f ||∞ = sup |f (t)|

t∈[a,b]
Cette dernière norme est la norme de la convergence uniforme (la convergence pour ||.||∞ coïncidera
avec la convergence uniforme)
Le lemme 1.17 se reformule en disant :
Lemme 2.1. (ℓ1 (I, IK), || · ||1 ) est un espace vectoriel normé.
Démonstration. || · || λ = µ = 1 du lemme 1.17). De plus || · ||1
1 vérie l'inégalité triangulaire (cas
est positif. Comme |ai | ≤ ||a||1 , ai = 0 si ||a||1 = 0, pour tout i donc a = 0 ce qui donne l'axiome
P P
de séparation. Enn i∈J |λai | = |λ| i∈J |ai | donc en passant au sup : |λ| ||a||1 = ||λa||1 (d'où
l'homogénéité).
Exemple .2.4 Si Z =X ×Y avec (X, dX ), (Y, dY ) des em. On dénit :
dZ ((x, y), (x′ , y ′ )) = max(dX (x, x′ ), dY (y, y ′ )).

C'est une distane sur Z (exo) que l'on utilisera dans cette situation ultérieurement (distance produit).
Exemple .2.5 R = IR ∪ {−∞, ∞} est un espace métrique avec la distance

 min(1, |x − y|) si x, y ∈ IR
dIR (x, y) = 0 si x = y ∈ {−∞, +∞}
1 sinon

Proposition 2.2. (Inégalité triangulaire inverse) Soit (X, d) un em.

∀x, y, z ∈ X d(x, z) − d(y, z) ≤ d(x, y).
Démonstration. Cas d(x, z) ≥ d(y, z) : Comme d(x, z) ≤ d(x, y) + d(y, z) par l'inégalité triangulaire,
on en déduit d(x, z) − d(y, z) = d(x, z) − d(y, z) ≤ d(x, y).
Dans le cas d(y, z) ≥ d(x, z), on échange x et y par symétrie.
2 Métriques équivalentes
Dénition 2.3. Soit X un ensemble. Deux distances d1 et d2 sur X sont dites équivalentes si
∃c, C > 0, ∀x, y ∈ X, cd1 (x, y) ≤ d2 (x, y) ≤ Cd1 (x, y).

On note alors d1 ∼ d2 . Des normes sont équivalentes si les distances induites le sont.
Remarque . 2.1 L'équivalence des distances est une relation d'équivalence, c'est à dire qu'elle est
réexive (d1 ∼ d1 ), symétrique (d1 ∼ d2 ⇒ d2 ∼ d1 ) et transitive ( d1 ∼ d2 , d2 ∼ d3 ⇒ d1 ∼ d3 ). Si
deux normes sont équivalentes les notions d'analyses (limite, continuité, ...) sont les mêmes pour les
deux normes.
Exemple .2.6
n
Dans IR , ||.||1 , ||.||2 , ||.||∞ sont équivalentes (cf. TD de L2). On verra plus tard qu'en
dimension nie toutes les normes sont équivalentes.
18
3 Boules dans un e.m.
Dénition 2.4. a∈X r ∈ [0, ∞[.
boule ouverte de centre a et de rayon r
Soient et
On appelle de X la partie :
B(a, r) = {x ∈ E, | d(x, a) < r}.

et boule fermée de centre a et de rayon r de E la partie :
BF (a, r) = {x ∈ E, | d(x, a) ≤ r}.

On appelle sphère de centre a et de rayon r de E la partie :
S(a, r) = {x ∈ E, | d(x, a) = r}.

Dans le cas r = 0, B(x, 0) = ∅, BF (x, 0) = {x}.
Exercice . 2.2
2
Dessiner les boules de IR pour ||.||1 , ||.||2 , ||.||∞
3.1 Parties bornées

Dénition 2.5. Un ensemble A⊂X est dit borné si ∃M ∈ [0, ∞[, a ∈ X∀x ∈ A, d(x, a) ≤ M , c'est
à dire s'il est contenu dans une boule.
4 Suites dans un e.m.

On rappelle qu'une suite de E est une application u : IN → E notée (un )n≥0 .
4.1 Convergence
Dénition 2.6. (Convergence) Soit(un ) une suite d'un em (X, d). On dit que un converge vers
l ∈ X (et on note l = limn→∞ un ou un →n→∞ l) si la suite numérique d(un , l) converge vers 0,
c'est-à-dire :
∀ϵ > 0, ∃n0 ∈ IN, ∀n ≥ n0 , d(un , l) ≤ ϵ.
Remarque . 2.2 Ceci équivaut à ∀ϵ > 0, ∃n0 ∈ IN, ∀n ≥ n0 ,
un ∈ B(l, ϵ). Comme dans IR on a
unicité de la limite (justiant la notation). En eet si on a deux limites l1 , l2 pour n grand un ∈
B(l1 , ϵ) ∩ B(l2 , ϵ) donc par inégalité triangulaire d(l1 , l2 ) ≤ d(l1 , un ) + d(un , l2 ) ≤ 2ϵ Comme ϵ > 0
arbitraire d(l1 , l2 ) = 0, soit par l'axiome de séparation l1 = l2 .
Proposition 2.3. (i) Si u → u, alors pour tout x, d(u , x) → d(u, x).

(ii) Toute suite convergente est bornée (réciproque fausse).
n n
(iii) Si E est un evn u → u, v → v alors pour toute suite λ ∈ IK, tel que λ → λ on a
λ u + v → λu + v .
n n n n
n n n
Démonstration. |d(u , x) − d(u, x)| ≤ d(u , u)

(i) Par l'inégalité triangulaire inverse n n
(ii) Par (i) et le cas réel.
(iii) Vu λn un + vn − (λu + v) = λn (un − u) + (vn − v) + (λn − λ)u, homogénéité et inégalité
triangulaire implique :
||λn un + vn − (λu + v)|| ≤ |λn |||un − u|| + ||vn − v|| + |λn − λ|||u|| → 0.
19
4.2 Suite extraite, valeur d'adhérence
Dénition 2.7. Soit (un ) une suite de X on appelle suite extraite ou sous-suite une suite de la forme
vn = uϕ(n) , pour ϕ : IN → IN une application strictement croissante
Dénition 2.8. valeur d'adhérence

On appelle (u ) d'une suite n toute limite d'une suite extraite
convergente.
Proposition 2.4. Toute suite extraite d'une suite convergente converge vers la même limite. (Au-
trement dit, toute suite convergente n'a qu'une seule valeur d'adhérence, sa limite.)
Démonstration. u → l
Supposons n v et si d(v , l)
n une suite extraite, d(u , l)
n est extraite de n ( le
résultat est donc une conséquence du cas réel).
5 Suite de Cauchy, Complétude

Dénition 2.9. Une suite (un ) de X est dite de Cauchy si :
∀ϵ > 0, ∃N ∈ IN, ∀(p, q) ∈ IN2 , p ≥ N et q ≥ N → d(up , uq ) ≤ ϵ.

La proposition suivante est similaire au cas réel (cf. cours de L2).
Proposition 2.5. Toute suite convergente est de Cauchy. Toute suite de Cauchy est bornée. Toute
suite de Cauchy possédant une valeur d'adhérence est convergente.
Dénition 2.10. X complet X
espace de Banach
Un espace métrique est dit si toute suite de Cauchy de converge
dans X . Si un evn E est complet on dit que c'est un .
On a vu en première année que IK est complet (mais pas Q).

l Vous avez vu en L2 que (IRn , || · ||2 )
est complet. On verra que tout evn de dimension nie est complet.
Proposition 2.6. Un evn E est complet si et seulement si toute série absolument convergente est
convergente.
Démonstration.
P p
Si E est complet et (xi ) est absolument convergente, la suite des sommes partielles
Pq−1 Pq
Sp = x
i=1 i vérie, pour q > p, ||Sp − Sq || ≤ k=p ||xi || donc comme k=1 ||xi || est convergente
donc de Cauchy, on déduit que (Sp ) est de Cauchy donc converge.
Réciproquement, si toute suite absolument convergente converge, soit (xi ) une suite de Cauchy. Il
sut de montrer qu'elle admet une sous-suite convergente pour voir qu'elle converge. Par la propriété
1
de Cauchy, on trouve par induction ||xnk+1 || avec ||xnk+1 −xnk || ≤ k de sorte que la série télescopique
P 2
xnk+1 − xnk est absolument convergente donc converge, et donc la sous-suite (xnk ) converge.
Exemple . 2.7 Dans le cadre de l'exemple 2.3, vous avez vu en L2 que toute série normalement conver-
gente de (C 0 ([a, b], IR), ||.||∞ ) converge uniformément. D'après le résultat précédent, c'est équivalent
0
à dire que (C ([a, b], IR), ||.||∞ ) est un
espace de Banach (aussi vu directement en L2 en analyse 2
0
Prop 7.6). Par contre ce n'est pas le cas de (C ([a, b], IR), ||.||i ), i = 1, 2. On verra qu'ils sont denses
i
dans les espaces de Lebesgue L ([a, b], IR) qui seront eux complets, et sont les constructions de base
de la théorie de l'intégration de Lebesgue.
Proposition 2.7. Si X, Y sont des em complets. Alors X × Y (munie de la distance produit de

l'exemple 2.4) est complet.
Démonstration. (u , v )
Si n n X ×Y
est de Cauchy dans (u ) , de même,X n(v )est de Cauchy dans , et n
dans Y , donc par complétude (un ) converge vers u et (vn ) vers v . En conséquence (un , vn ) converge
vers (u, v) vu d((un , vn ), (u, v)) = max(d(un , u), d(vn , v)) → 0.
20
5.1 Théorème de Point xe
Théorème 2.8. Soit (X, d) un espace métrique complet, et f : X → X une application telle que
∃k < 1 ∀x ̸= y ∈ X d(f (x), f (y)) ≤ kd(x, y) .
Alors f admet un unique point xe.

Démonstration. x ∈ X Soit 0 on dénit par récurrence xn = f (xn−1 ) = f ◦n (x0 ). Donc
d(xn+1 , xn ) = d(f (xn ), f (xn−1 )) ≤ kd(xn , xn−1 ) ≤ k n d(x1 , x0 ). (2.1)
Montrons que xn est bornée en voyant par récurrence que d(xn , x0 ) ≤

Pn−1 i
i=0 k d(x1 , x0 ). C'est
évident pour n = 1. Et par l'inégalité triangulaire et (2.1) :
n−1
X n
X
n i
d(xn+1 , x0 ) ≤ d(xn+1 , xn ) + d(xn , x0 ) ≤ k d(x1 , x0 ) + k d(x1 , x0 ) = k i d(x1 , x0 )
i=0 i=0
1
Or on reconnaît une série géométrique convergente, d'où la borne : d(xn+1 , x0 ) ≤ 1−k
d(x1 , x0 ).
Montrons que xn est de Cauchy. En eet, pour m > n,
1
d(xn , xm ) = d(f ◦n (x0 ), f ◦n (xm−n ) ≤ k n d(x0 , xm−n ) ≤ k n d(x1 , x0 )
1−k
1
Comme k n 1−k → 0, on déduit que pour N m > n ≥ N d(xn , xm ) est arbitrairement
grand et
petit, donc xn est de Cauchy. Par complétude de X , on obtient donc que xn converge, disons
vers x. Maintenant, en passant à la limite dans (2.1), on obtient d(f (x), x) = limn d(f (xn ), xn ) ≤
lim supn d(f (xn ), xn ) ≤ lim supn k n d(x1 , x0 ) = 0 donc par séparation f (x) = x et x est le point xe
cherché.
6 Ouverts dans un em.

Soit (X, d) un em.
Dénition 2.11. Une partie O⊂X est un ouvert (ou une partie ouverte) si
∀x ∈ O, ∃r > 0, B(x, r) ⊂ O.
6.1 Exemples d'ouverts et propriétés

X, ∅ sont des ouverts de X . [a, b], [a, b[ ne sont pas ouverts dans IR mais ]a, b[ l'est.
Proposition 2.9. Les boules ouvertes sont ouvertes.

On remarquera que le mot ouvert a deux sens dans "boules ouvertes" et "parties ouvertes" mais
qu'ils sont cohérents grâce à la proposition (les boules fermées ne sont pas des ouverts, cf. TD).
21
Démonstration. Soit a ∈ X, r > 0 montrons que B(a, r) est un ouvert (B(a, 0) est vide donc ouvert).
Soit x ∈ B(a, r), r − d(x, a) > 0, il sut donc de montrer que :
B(x, r − d(x, a)) ⊂ B(a, r).
C'est une conséquence de l'inégalité triangulaire. En eet, si y ∈ B(x, r − d(x, a)), alors d(y, a) ≤
d(y, x) + d(x, a) < (r − d(x, a)) + d(x, a) = r, donc y ∈ B(a, r).
Proposition 2.10. 1. La partie vide ∅ et X sont des ouverts.

2. la réunion d'une famille d'ouverts est ouverte.
3. l'intersection d'une famille nie d'ouverts est ouverte.
Remarque . 2.3 topologie
On appelle une famille de parties d'un ensemble, qui, comme la famille des
ouverts d'un em, vérie ces trois propriétés. La famille des ouverts de X est donc appelée topologie
(métrique) de X . ∩n∈IN B(a, 1/n) = {a} qui n'est pas ouvert dans X montre que l'hypothèse "nie"
est cruciale dans 3.
Démonstration. 1. évident.
2. Soit (Oi )i∈I une famille d'ouverts. On peut supposer I non vide (sinon l'union vide étant vide
on est ramené à 1). Soit x ∈ O = ∪i∈I Oi , donc il existe j ∈ I , x ∈ Oj . Comme Oj est ouvert
il existe r > 0, B(x, r) ⊂ Oj ⊂ O. Donc O est ouvert.
3. Soit O1 , ..., On x ∈ O = O1 ∩ · · · ∩ On . Comme x ∈ Oi , et Oi
une famille nie d'ouverts. Soit
ri > 0, B(x, ri ) ⊂ Oi . Soit r = mini=1...n ri > 0. On déduit de la dénition que
ouvert, il existe
B(x, r) ⊂ B(x, ri ) ⊂ Oi donc B(x, r) ⊂ O, ce qui montre que O est ouvert.
Exemple . 2.8 Soit O = {(x, y), x > 0}. 2

Montrons que c'est un ouvert de IR pour la norme ||.||∞ . En
eet
O = ∪(x,y)∈O ]0, 2x[×]y − x, y + x[= ∪(x,y)∈O B||.||∞ ((x, y), x),
est ouvert comme union d'ouverts.
Proposition 2.11. (Ouverts pour la métrique induite) Soit A ⊂ (X, d) avec la métrique induite, O
est un ouvert de A, si et seulement si il existe un ouvert U de X tel que O = U ∩ A.
Démonstration. O
On suppose A
ouvert de x∈O
. Pour chaque r >0 B (x, r ) ⊂ O
, on xe x tel que A x .
On pose alors
[
U= BX (x, rx )
x∈O
qui est un ouvert de X SO ⊂ U ∩ A car rx > 0 donc pour tout x ∈ O,

par union de boules ouvertes. Or
S
x ∈ BX (x, rx ) ⊂ U . Et U ∩ A = x∈O BX (x, rx ) ∩ A = x∈O BA (x, rx ) ⊂ O. Donc U ∩ A = O.
Réciproquement, comme U est ouvert soit x ∈ O ⊂ U , il existe r > 0, BX (x, r) ⊂ U donc
BA (x, r) = BX (x, r) ∩ A ⊂ U ∩ A = O donc O est ouvert dans A.
22
6.2 Intérieur
Dénition 2.12. Soit A ⊂ X, on dit que x est intérieur à A (ou A est un voisinage de x) si
∃r > 0, B(x, r) ⊂ A.
On note Int(A) ou Å l'ensemble des points intérieurs à A.
Proposition 2.12. Int(A) est le plus grand ouvert contenu dans A.

Démonstration. 1. Int(A) contient tous les ouverts inclus dans A.
SoitU un ouvert contenu dans A. Soit x ∈ U , alors comme U est ouvert, ∃r > 0, B(x, r) ⊂
U ⊂ A, donc x est intérieur à A. Ainsi U ⊂ Int(A)
2. Int(A) est un ouvert. Soit x ∈ Int(A). Soit donc r > 0 tel que B(x, r) ⊂ A. Comme
B(x, r) est ouvert, tout y ∈ B(x, r) est intérieur à B(x, r) donc intérieur à A. En bilan,
∀x ∈ Int(A), ∃r > 0, B(x, r) ⊂ Int(A), ce qui conclut.
Corollaire 2.13. (exo, cf TD)

1. A ouvert si et seulement si A = Int(A).
2. A ⊂ B ⇒ Int(A) ⊂ Int(B)
3. Int(A) ∪ Int(B) ⊂ Int(A ∪ B)
4. Int(A) ∩ Int(B) = Int(A ∩ B)
Exemple . F = {(x, y), x ≥ 0}
2.9 Soit . Montrons que Int(F ) = O := {(x, y), x > 0}. On a vu
à l'exemple 2.8 que O est ouvert, donc comme O ⊂ F, on a O ⊂ Int(F ). Il reste à voir que
Int(F ) ∩ {(x, y), x = 0} = ∅ (car alors Int(F ) ⊂ F − {(x, y), x = 0} = O). Mais soit (−ϵ, y) ∈
B||.||∞ ((0, y), ϵ) ∩ F c pour tout ϵ > 0, donc B||.||∞ ((0, y), ϵ) ̸⊂ F donc (0, y) n'est pas intérieur à F , ce
qu'il fallait démontrer.
7 Fermés dans un em.

Soit (X, d) un em.
Rappel . A ⊂ X , on note Ac = {x ∈ X | x ̸∈ A} le complémentaire de A. On rappelle

2.4 Soit que
∅ = X, X = ∅, (Ac )c = A, A ∪ Ac = X, A ∩ Ac = ∅. Les lois de De Morgan impliquent que pour
c c
une
famille (Ai )i∈I
!c
[ \
Ai = Aci ,
i∈I i∈I
!c
\ [
Ai = Aci .
i∈I i∈I
Dénition 2.13. Soit F ⊂ X. On dit que F est un fermé de X si Fc est un ouvert de X.

Le résultat suivant est obtenu en passant au complémentaire le résultat sur les ouverts.
Proposition 2.14. 1. La partie vide ∅ et X sont des fermés.

2. l'intersection d'une famille de fermés est fermée.
3. l'union d'une famille nie de fermés est fermée.
23
Proposition 2.15. (Caractérisation séquentielle des fermés) Une partie F d'un em X est fermée si
et seulement si toute suite convergente (x ) d'éléments de F a sa limite dans F .
n
Démonstration.
c
Supposons
c
F fermé. Soit(x ) n F x
une suite d'éléments de
c
, convergente vers . Soit
y∈F , comme F est ouvert il existe ϵ > 0 B(y, ϵ) ⊂ F , d'où xn ̸∈ B(y, ϵ) Donc d(xn , y) ≥ ϵ. En
passant à la limite on déduit
d(x, y) ≥ | d(xn , x) − d(xn , y) | ≥ ϵ − d(xn , x) →n→∞ ϵ > 0,
Donc d(x, y) ≥ ϵ donc x ̸= y . Comme y était arbitraire dans F c, x ∈ F .

Réciproquement, supposons que F n'est pas fermé et montrons que la seconde caractérisation est
c c
fausse. Soit x ∈ F montrant que F n'est pas ouvert, donc pour tout n ∈ IN, B(x, 1/n) ∩ F ̸= ∅. Soit
xn ∈ B(x, 1/n) ∩ F d(xn , x) ≤ 1/n →n→∞ 0, donc (xn ) est une suite d'éléments de F qui converge
c
vers x ∈ F .
Exemple 2.10 . A = {(x, y), x > 0, y > 0} n'est pas

Montrons avec la caractérisation séquentielle que
fermé pour la norme ||.||∞ .
A ∋ (1/n, 1/n) → (0, 0) ̸∈ A, ce qui contredirait l'hypothèse que
En eet
A fermé. Montrons de même que B = {(x, y), x ≥ 0, y ≥ 0} est fermé. En eet, Soit (xn , yn ) ∈ B tel
que (xn , yn ) → (x, y) on a xn → x, yn → y donc comme xn ≥ 0, on déduit x ≥ 0, et de même y ≥ 0
donc (x, y) ∈ B . Ainsi, comme toute limite de suite de B est dans B , on déduit que B est fermé.
Vous avez vu en L2 le résultat suivant :
Proposition 2.16. (Relations Fermé-Complet) Soit E un espace métrique.

1. Si C ⊂ E est complet alors il est fermé.
2. Si C ⊂ E est complet et F ⊂ C est un fermé de E, alors F est complet.
Démonstration. C⊂E 1. Si (x )
est complet alors si on considère une suite n convergente vers x
dans E, elle est de Cauchy, donc converge dans C, donc x∈C par unicité de la limite.
2. Si C⊂E est complet et F ⊂ C . Soit xn une suite de Cauchy de F , elle converge dans C , donc
comme F est fermé, la limite est dans F , donc toute suite de Cauchy de F converge dans F .
En passant au complémentaire la proposition 2.11, on obtient :
Proposition 2.17. (Fermés pour la métrique induite) Soit A ⊂ (X, d) avec la métrique induite, F
est un fermé de A, si et seulement si il existe un fermé C de X tel que F = C ∩ A.
7.1 Adhérence
Dénition 2.14. A ⊂ X . Un point x ∈ X est dit
Soit adhérent à A si ∀ϵ > 0B(x, ϵ) ∩ A ̸= ∅.
On note Ā (ou Adh(A)) l'ensemble des points adhérents à A.
Exemple 2.11 . X̄ = X, ∅¯ = ∅, A ⊂ Ā . Si r > 0, B(a, r) = BF (a, r). Si A = {xn }n∈IN les valeurs
d'adhérence de la suite (xn ) sont dans Ā qui est l'union de l'ensemble des valeurs d'adhérence et de
A (exo).
Proposition 2.18.
(Adh(A))c = Int(Ac ).
(Int(B))c = Adh(B c ).
24
Démonstration. Un point x ∈ X n'appartient pas à Adh(A) si et seulement si ∃ϵ > 0, B(x, ϵ) ∩ A =
∅ ⇐⇒ ∃ϵ > 0, B(x, ϵ) ⊂ Ac . C'est par dénition équivalent à dire que x est un point adhérent à
Ac .En appliquant le premier résultat à A = B c , on en déduit le second.
On en déduit toutes les propriétés en passant au complémentaire celles de l'intérieur.
Corollaire 2.19. 1. Ā est le plus petit fermé contenant A.

2. A fermé si et seulement si A = Ā.
3. A ⊂ B ⇒ Ā ⊂ B̄
4. Ā ∩ B̄ ⊃ A ∩ B
5. Ā ∪ B̄ = A ∪ B
Démonstration. Ā
c
1.
c c
c
est fermé vu que son complémentaire est l'ouvert Int(A ). Si F est un fermé
contenant A, F est un ouvert contenu dans A donc dans Int(A ) le plus grand ouvert contenant
Ac . En passant au complémentaire, F ⊃ Ā. Les résultats 2.3.4.5 sont analogues, par passage au
complémentaire, de résultats sur l'intérieur.
Proposition 2.20. (Caractérisation séquentielle de l'adhérence) x ∈ Ā si et seulement si il existe

une suite (a ) d'éléments de A vériant a → x.
n n
Démonstration. A
Si x est adhérent à n B(x, 1/n) ∩ A
pour tout entier est non vide donc contient
IN
un élément an . La suite (an ) ∈ A converge vers x vu ||an − x|| ≤ 1/n → 0. La réciproque vient de
la caractérisation séquentielle des fermés vu Ā fermé.
Exemple 2.12 . A = {(x, y), x > 0, y > 0} alos A = B = {(x, y), x ≥ 0, y ≥ 0}. On a
Montrons que si
vu à l'exemple 2.10 que B A ⊂ B , on en déduit A ⊂ B
est fermé, donc comme
Il reste à montrer que B − A = {(x, y), x = 0, y ≥ 0 ou y = 0, x ≥ 0} ⊂ A. Or (0, y) =
limn→∞ (1/n, y + 1/n) et si y ≥ 0, (1/n, y + 1/n) ∈ A, donc (0, y) ∈ A. De même (x, 0) = limn→∞ (x +
1/n, 1/n) ∈ A si x ≥ 0.
7.2 Densité, Frontière

Dénition 2.15. Une partie A est dite dense dans X si Ā = X .
Exemple 2.13 Q .
l et Q
l
c
sont denses dans IR.
Dénition 2.16. Un point x ∈ X est dit point frontière d'une partie A si pour tout r > 0, B(x, r)
est d'intersection non vide avec A et Ac . On note Fr(A) l'ensemble des points frontières de A.
Remarque . 2.5 D'après la dénition, Fr(A) = Fr(Ac ) = Ā ∩ Ac est un fermé.
Exercice .2.3 Montrer que Int(Ac ), Fr(A), Int(A) forment une partition de X (i.e. sont disjoints deux
à deux et leur union est X ).
25
8 Fonctions continues
8.1 Dénitions équivalentes
On considère (X, dX = d) et (Y, dY = d) deux em.
Dénition 2.17. Soient A ⊂ X, Y des em f :A→Y.

1. Soit a ∈ A, f est dit continue en a si limx→a f (x) = f (a), soit
∀ϵ > 0, ∃δ > 0, ∀x ∈ AdX (x, a) < δ ⇒ dY (f (x), f (a)) < ϵ.
2. f est continue sur A si f est continue en tout point de A. Autrement dit,
∀a ∈ A, ∀ϵ > 0, ∃δ > 0, ∀x ∈ AdX (x, a) < δ ⇒ dY (f (x), f (a)) < ϵ.
Remarque : δ = δ(a, ϵ) dépend à la fois de ϵ et de a. Vous avez vu en L2, le résultat suivant.
Proposition 2.21. (Caractérisation séquentielle de la continuité) Soit f : X → Y . L'application f

est continue en x ∈ X si et seulement si pour toute suite (x ) d'éléments de X : si x converge vers
x, alors f (x ) converge vers f (x).
n n
n
Démonstration. f
Supposons que l = f (x) x
tend vers ϵ > 0 η > 0 en . Soit il existe tel que
f (B(x, η)) ⊂ B(l, ϵ). Vu que xn → a il existe N , tel que ∀n ≥ N, d(xn , a) ≤ η donc ∀n ≥
N, d(f (xn ), l) ≤ ϵ. Ceci indique que f (xn ) → l.
Réciproquement, supposons par contraposition, qu'il existe ϵ > 0 tel que pour tout η > 0
f (B(x, η)) ∩ B(l, ϵ)c ̸= ∅. Donc, en prenant, η = 1/n, on obtient xn ∈ B(x, 1/n), tel que d(f (xn ), l) ≥
ϵ. Pour tout n, donc xn → a et f (xn ) ne converge pas vers l comme voulu.
Proposition 2.22. (Caractérisation topologique de la continuité) Soit f : X → Y . Les assertions

suivantes sont équivalentes :
1. f est continue sur X .
2. Pour tout ouvert O de Y , l'image inverse f (O) est ouverte dans X . −1
3. Pour tout fermé F de Y , l'image inverse f (F ) est fermée dans X . −1
Démonstration. 2. ⇐⇒ 3. (f (B)) = (f (B ))
vient de
−1 c −1 c
et de la relation fermés/ouverts.
1. ⇒ 2. Soit O Y et x ∈ O, il existe et on choisit ϵ(x) > 0 tel que B(x, ϵ(x)) ⊂ O.
un ouvert de
Par continuité de y ∈ f −1 (O), f (y) = x ∈ O, il existe δ(y) > 0 tel que f (B(y, δ(y))) ⊂
f, soit
B(x, ϵ(f (y))) ⊂ O. Donc B(y, δ(y)) ⊂ f −1 (O) et comme y est arbitraire, f −1 (O) est ouvert.
2. ⇒ 1. Soit a ∈ A. Montrons que limx→a f (x) = f (a). Soit ϵ > 0. Par 1. V = f −1 (B(f (a), ϵ)) est
un ouvert X . Or a ∈ V donc ∃δ > 0 tel que B(a, δ) ⊂ V . En conséquence
f (B(a, δ)) ⊂ f (V ) = f (f −1 (B(f (a), ϵ))) ⊂ B(f (a), ϵ),
ce qui conclut.
Corollaire 2.23. (Stabilité par composition de la continuité) Si f : X → Y et g : Y → Z sont

continues, alors , g ◦ f : X → Z est continue.
Démonstration. U Z g (U )
Pour tout ouvert de ,Y−1
−1 −1
g f (g (U ))
est ouvert de
−1
par coninuité de , puis
−1 −1
est ouvert par coninuité de f, mais f (g (U )) = (g ◦ f ) (U ). Comme c'est vrai pour tout ouvert
U, on déduit de nouveau du théorème précédent que g ◦ f est continue.
26
Exemple 2.14 . 1. f : X → IR dénit par f (x) = d(x, z) est continue sur E car |d(x, z) −
d(x0 , z)| ≤ d(x, x0 ) (inégalité triangulaire inverse).
2. Soit 0 ≤ p ≤ n = r + s, p : Rn → IRs dénie par si x = (y, z) ∈ IRn = IRr × IRs , p(x) = z . On
n s
munit IR et IR des normes ||.||1 , on voit ||p(x)||1 ≤ ||x||1 , donc comme p est linéaire, p est
continue car ||p(x) − p(y)||1 = ||p(x − y)||1 ≤ ||x − y||1 .
Remarque . 2.6 Il résulte des théorèmes sur les limites que les opérations algébriques usuelles (somme,
produit, composition) préservent la continuité. En particulier si P est une fonction polynomiale
P : IRn → IR c'est à dire de la forme P (x) = finie ai1 ,...,in xi11 . . . xinn est continue comme somme et
P
produits des projections (x1 , ..., xn ) 7→ xi .
Théorème 2.24 . Si f, g : (X, d) → (Y, d) sont deux applications

continues et D ⊂ X est dense. Si f et g sont égales sur D, alors elles sont égales (sur tout X ).
(de prolongement des identités)
Démonstration. x ∈ X Soit a ∈D
, on sait par caractérisation séquentielle de l'adhérence qu'il existe n
avec an → x. Par continuité de f, g en x, et caractérisation séquentielle de la continuité : f (an ) →
f (x), g(an ) → g(x). Mais on sait que f (an ) = g(an ) par hypothèse, donc par unicité de la limite dans
Y , f (x) = g(x). Comme x est arbitraire, on a f = g .
8.2 Homéomorphismes, Continuité uniforme, Lipschitzianité

Dénition 2.18. Une application f : X → Y est dite un homéomorphisme (ou une application
bicontinue) si elle est bijective et si f : X → Y et f −1 : Y → X sont continues.
Dénition 2.19. Une application f :X→Y est uniformément continue si :
∀ϵ > 0, ∃δ > 0 : ∀(x, x′ ) ∈ X 2 , d(x, x′ ) ≤ δ ⇒ d(f (x), f (y)) ≤ ϵ.
Une application f :X→Y est K-lipschitzienne avec K ∈ [0, +∞[ si :
∀(x, y) ∈ X 2 , d(f (x), f (y)) ≤ Kd(x, y).
Remarque : dans la continuité uniforme, δ = δ(ϵ) ne dépend PAS de x, contrairement au cas de

la continuité.
Proposition 2.25. Une application uniformément continue est continue.

Proposition 2.26. Un application K-lipschitzienne est uniformément continue.
Démonstration. ϵ > 0 Pour δ = ϵ/K
dans la dénition il sut de prendre .
Exemple . f : → f (x) = √x
2.15 IR+ IR est uniformément continue mais pas lipschitzienne (cf TD.).
Toute application uniformément continue est continue mais la réciproque est fausse : g : IR → IR
g(x) = x2 n'est pas uniformément continue sur IR (cf TD.).
x 7→ d(x, z) est 1-lipschitzienne X → IR, (x, y) 7→ x + y est 2-lipschitzienne E × E → E.
Le résultat suivant ne doit pas être confondu avec le Théorème 2.24qui ne donne que l'unicité
d'un prolongement mais pas son existence.
Théorème 2.27 (de prolongement des applications uniformément continues). Si f : (D, d) → (Y, d)
est une applications , D ⊂ (X, d) est dense et (Y, d) est . Alors
f admet un unique prolongement continue g : (X, d) → (Y, d) et celui-ci est uniformément continue.
uniformément continue complet
27
Démonstration. L'unicité vient du Théorème 2.24.
Soit x ∈ X , et par densité xn ∈ D, xn → x. Comme f est uniformément continue soit ϵ > 0 et
δ > 0 tel que dX (x, y) < δ ⇒ dY (f (x), f (y) ≤ ϵ. Si on prend N tel que d(xn , xm ) < δ , pour n, m ≥ N ,
on voit que dY (f (xn ), f (xm )) ≤ ϵ, donc comme ϵ est arbitraire, (f (xn )) est de Cauchy. Donc (f (xn ))
converge vers z ∈ Y par complétude.
Soit yn → x une autre telle suite, alors d(f (yn ), z) ≤ d(f (xn ), f (yn )) + d(f (xn ), z) → 0, car
d(f (xn ), f (yn )) ≤ ϵ dès que d(xn , yn ) ≤ δ et on voit donc que d(xn , yn ) → 0 implique que d(f (xn ), f (yn )) →
0. Donc la limite z ne dépend pas de la suite choisie. On pose g(x) = z .
En particulier, g étend f (en considérant la suite constante). Soit z ∈ X avec d(x, z) < δ et
zn → z alors pour n assez grand d(xn , zn ) < δ donc dY (f (xn ), f (zn ) ≤ ϵ et on déduit en passant à la
limite dY (g(x), g(z)) ≤ ϵ. Donc g est uniformément continue (avec même constantes que f ).
8.3 Fonctions continues bornées

Exemple 2.16 . Soit X un espace métrique, F un e.v.n. et Cb (X, F ) l'ensemble des fonctions continues
bornées sur X à valeur dans F, on a la norme uniforme (exo : vérier que c'est bien une norme) :
||f ||∞ = sup ||f (x)||F

x∈X
Le résultat suivant a été vu en L2 pour F = IR.

Théorème 2.28. Les espaces (C (X, F ), ||.|| ), pour X espace métrique et F espace de Banach est
un espace de Banach.
b ∞
Démonstration. f
On a vu que ce sont des espaces normés. Montrons qu'ils sont complets. Soit n
une suite de Cauchy, donc comme ||fp (x) − fq (x)||F ≤ ||fp − fq ||∞ , pour tout x ∈ X , (fp (x)) est de
Cauchy, donc par complétude de F , converge vers une valeur f (x). Soient p, q tels que pour tout x
||fp (x) − fq (x)|| ≤ ϵ en prenant la limite q → ∞, on déduit ||fp (x) − f (x)|| ≤ ϵ donc ||fp − f || ≤ ϵ.
Donc fp converge uniformément vers f , donc f est continue (résultat de L2 ou exo). De plus, ||fp ||∞
est convergente, donc de Cauchy, donc bornée, disons par M . En passant à la limite dans l'inégalité
||fp (x)||F ≤ M , on obtient ||f (x)||F ≤ M et donc f est aussi bornée par M . Donc la limite f est
continue bornée et fp converge vers f dans Cb (X, F ). Ce qui donne la complétude.
9 Applications linéaires continues

On considère (E, ||.||) et (F, ||.||) deux evn.
Rappel . 2.7 Une application u:E→F est dite linéaire si :
(i) ∀x, y ∈ E, u(x + y) = u(x) + u(y)

(ii) ∀x ∈ E, λ ∈ IK, u(λx) = λu(x).
Proposition 2.29. Si u : E → F est une application linéaire, les assertions suivantes sont équiva-
lentes :
1. u est lipschitzienne.
2. u est continue.
3. u est continue en 0.
4. u est continue en un point.
28
5. Il existe a ∈ E,η > 0 tel que u(B(a, η)) ⊂ B(u(a), 1).
6. u est bornée sur la boule unité fermée B (0, 1) E
Démonstration. 1. ⇒ 2. 2. ⇒ 3. 3. ⇒ 4. 4. ⇒ 5.
(Preuve facultative) , , , sont évidentes (et n'utilisent
pas la linéarité). Si on suppose 5., il existe η > 0 tel que si ||x − a|| ≤ η alors ||u(x) − u(a)|| ≤ 1. Soit
h ∈ E , h ̸= 0, x = a+hη/||h|| de sorte que ||x−a|| ≤ η , on déduit donc ||u(h)||η/||h|| = ||u(x−a)|| ≤ 1
c'est-à-dire ||u(h)|| ≤ ||h||/η (ce qui est aussi vrai pour h = 0). En particulier, si ||h|| ≤ 1, on obtient
donc 6.
Si on suppose 6., on montre nalement 1, on pose C = sup||h||≤1 ||u(h)|| < ∞ et on obtient de
même pour h ̸= 0, ||u(h/||h||)|| ≤ C donc ||u(h)|| ≤ C||h|| (ce qui est aussi vrai pour h = 0). Donc
pour tout x, y en utilisant encore la linéarité u(x − y) = u(x) − u(y), on obtient :
||u(x) − u(y)|| ≤ C||x − y||,
donc u est C -lipschitzienne.

Proposition 2.30. Si ϕ : E → IK est une application linéaire (forme linéaire), ϕ est continue si et
seulement si son noyau H = Ker ϕ = ϕ ({0}) est fermé. −1
Démonstration. ϕ Si ϕ ({0})
est continue,
−1
est fermé comme image inverse d'un singleton, qui est
fermé. Réciproquement, supposons ϕ non nulle, soit e tel que ϕ(e) = 1. Comme le complémentaire
c
de H est ouvert soit r > 0 tel que B(e, r) ⊂ H .
Montrons par l'absurde que pour tout x ∈ B(e, r), ϕ(x) ∈ B(1, 1). En eet, sinon soit x avec
|ϕ(x)−1| ≥ 1. Si t = −ϕ(x)/(1−ϕ(x)), on ϕ(te+(1−t)x) = t1+(1−t)ϕ(x) = t(1−ϕ(x))+ϕ(x) = 0.
Or ||te + (1 − t)x − e|| = |1 − t|||x − e|| = ||x − e||/|ϕ(x) − 1| ≤ r une contradiction car alors
y = te + (1 − t)x ∈ B(e, r) ∩ H .
On a donc vu ϕ(B(e, r)) ⊂ B(ϕ(e), 1) d'où ϕ continue par la proposition précédente.
Dénition 2.20. L'espace E ′ := L(E, IK) des formes linéaires continues sur un e.v.n. E est munie
de la norme d'opérateur
||f ||E ′ := sup |f (x)|.
x∈E,||x||E ≤1
Dénition 2.21. L'espace L(E, F ) des applications linéaires continues d'un e.v.n. E vers un e.v.n.
F est munie de la norme d'opérateur (ou norme subordonnée) :
|||f ||| := sup ||f (x)||F .

x∈E,||x||E ≤1
Remarque . 2.8 La preuve de 6. implique 5. dans la proposition 2.29 montre en fait que si f ∈ L(E, F )
alors f est |||f |||-lipschitzienne.
Un espace dual est toujours complet par le résultat suivant :
Théorème 2.31. Si E est un e.v.n. et F un espace de Banach, alors (L(E, F ), |||.|||) est un espace
de Banach.
Démonstration. Soit B la boule fermée de E de centre 0 et de rayon 1 et i : L(E, F ) → Cb (B, F ) la
restriction à la boule. Par dénition des normes, c'est une isométrie qui identie donc L(E, F ) à un
sous espace de Cb (B, F ). Montrons que ce sous espace est fermé (il sera donc complet par complétude
de Cb (B, F ) par théorème 2.28).
29
Montrons que
i(L(E, F )) = {u ∈ Cb (B, F ) : ∀λ, µ ∈ K|λ| + |µ| ≤ 1, ∀x, y ∈ B, u(λx + µy) = λu(x) + µu(y)}.
Cela sut car cela décrit i(L(E, F )) comme une u 7→ u(y) est une
intersection de fermé vu que
application continue sur Cb (B, F ). L'inclusion ⊂ u est continue
est évidente. Réciproquement si
x
sur B donc en 0 et dans l'ensemble indiqué, pour x ∈ E \ {0}, on pose uE (x) = ||x||E u( ) et
||x||E
uE (0) = 0. D'abord, si ||x|| ≤ 1 on remarque que uE étend la précédente valeure de u sur B (en
prenant y = 0 dans la relation). De même, uE est positivement homogène. Donc, si (x, y) ̸= 0, on
′ ′ ′ ′
pose x = x/ max(||x||, ||y||), y = y/ max(||x||, ||y||), λ = λ/(|λ|+|µ|), µ = µ/(|λ|+|µ|) pour obtenir
′ ′ ′ ′
par homogénéité et la relation appliquée à x , y , λ , µ :
uE (λx + µy) = (|λ| + |µ|) max(||x||, ||y||)u(λ′ x′ + µ′ y ′ )

= (|λ| + |µ|) max(||x||, ||y||)[λ′ u(x′ ) + µ′ u(y ′ )]
= λuE (x) + µuE (y)
Donc uE est linéaire continue en 0, donc linéaire continue et u = i(uE ) comme souhaité.
Dénition 2.22. Une application linéaire u:E→F est une isométrie (linéaire) si :
∀x ∈ E, ||u(x)|| = ||x||.
Proposition 2.32. Une isométrie (linéaire) est toujours injective.

Une isométrie u : E → F identie donc E au sous-espace vectoriel u(E) ⊂ F avec la norme
induite.
Démonstration. Si u(x) = 0 alors 0 = ||u(x)|| = ||x|| donc par séparation x = 0.
10 Propriétés particulières des evn de dimension nie.

10.1 Complétude
Théorème 2.33. Tout evn de dimension nie est complet.
Démonstration. C'est bien connu en dimension 1. On montre donc le résultat par récurrence sur la
dimension. On suppose donc le résultat acquis en dimension strictement inférieure à n, soit (E, ||.||)
de dimension n. Soit ϕ une forme linéaire non nulle sur E, son noyau F est de dimension (n − 1),
donc par hypothèse de récurrence (F, ||.||) (muni de la restriction de la norme de E ) est complet. Par
conséquent F est fermé dans E , donc ϕ est continue.
Soit e ∈ E avec ϕ(e) = 1. L'isomorphisme linéaire u : (λ, f ) → λe + f de IK × F (avec la
norme produit donc complet par la proposition 6) sur E est continue ((1 + ||e||)-lipschitzien). Son
isomorphisme réciproque est donné par :
∀x ∈ E, u−1 (x) = (ϕ(x), x − ϕ(x)e).

u−1 est donc aussi continue comme ϕ . u−1
étant lipschitzienne (car linéaire continue et par la
−1
proposition 2.29 ), si (xn ), suite de E , est de Cauchy u (xn ) ∈ IK × F l'est aussi donc converge par
−1 −1
complétude de IK × F , d'où xn = u(u (xn )) converge aussi par continuité de u .
30
10.2 Applications linéaires
Rappel . 2.9 Si E de dimension n
F de dimension p. Soit (e1 , ..., en ) une base de E , (f1 , ..., fp ) une
et
base de F . Une application linéaire u est décrite par sa matrice A = (aij )i∈[1,p],j∈[1,n] dans ces bases.
Pn Pp
Alors, si x = j=1 xj ej et y = u(x) = i=1 yi fi , on rappelle que :
n
X
yi = aij xj .
j=1
On dénit aussi la base duale (e∗1 , ..., e∗n ) de l'ev des formes linéaires sur E caractérisés par e∗j (ek ) =
1 si j=k et 0 sinon. En conséquence, pour tout x ∈ E :
n
X n
X
u(x) = xj u(ej ) = e∗j (x)u(ej ).
j=1 j=1
Théorème 2.34. Toute application linéaire entre evn de dimensions nies est continue (et même
lipschitzienne).
Démonstration. En utilisant la représentation du rappel
n
X
u= u(ei )e∗i ,
i=1
il sut de montrer que les formes linéaires e∗i sont continues. Mais Ker e∗i est un sous-espace vectoriel
de dimension ni donc complet (Théorème 2.33), donc fermé (proposition 2.16) dans E, d'où la
continuité voulue (proposition 2.30). La lipschitzianité vient de la proposition 2.29.
10.3 Équivalence des normes et conséquences.

Théorème 2.35. Toutes les normes d'un espace vectoriel normé de dimension nie sont équivalentes.
Démonstration. ||.||1 , et ||.||2 sont deux normes sur E . l'application linéaire identité u = IdE vu
Si
−1
de (E, ||.||1 ) vers (E, ||.||2 ) est continue ainsi que son inverse u (théorème 2.34), donc elles sont C
et 1/c-lipschitzienne respectivement (proposition 2.29). On en déduit, pour tout x ∈ E :
||x||2 = ||u(x) − u(0)||2 ≤ C||x||1 ,

1
||x||1 = ||u−1 (x) − u−1 (0)||1 ≤ ||x||2 ,
c
d'où l'équivalence des normes souhaitée.
Remarque 2.10 . Sur Rn on peut donc parler de continuité, limite etc. sans préciser la norme.
Proposition 2.36. Soient E un evn, A ⊂ E , f : A → IRn . Si x ∈ A, on note f (x) = (f1 (x), ..., fn (x))
où les f sont les fonctions composantes de f : f : A → IR.
Soit x ∈ Ā et b = (b , ..., b ) ∈ IR , alors on a l'équivalence :
i i
n
1 n
lim f (x) = b ⇐⇒ ∀i = 1...n lim fi (x) = bi .

x→a x→a
31
Démonstration. On a fi = pi ◦f , où pi est i-ème projection pi : IRn → IR dénie par pi (x1 , ..., xn ) = xi .
pi est continue d'après l'exemple 2.14.2.
Si limx→a f (x) = b, limx→a fi (x) = bi d'après le Théorème de composition des limites.
on déduit
n
Réciproquement, on munit IR de la norme ||.||∞ . Si pour tout i limx→a fi (x) = bi on a donc pour
ϵ > 0, l'existence de δi > 0 tel que si ||x − a|| ≤ δi , ||fi (x) − bi || ≤ ϵ. On pose δ = mini=1...n (δi ) > 0.
Donc si ||x − a|| ≤ δ , pour tout i ||fi (x) − bi || ≤ ϵ donc ||f (x) − b||∞ = max ||fi (x) − bi || ≤ ϵ.
Corollaire 2.37. Soient E un evn, A ⊂ E, f : A → IR . Si x ∈ A, on note f (x) = (f (x), ..., f (x))

n
où les f sont les fonctions composantes de f : f : A → IR. f est continue sur A (resp. en a ∈ A) si
1 n
et seulement si les f sont continues sur A (en resp. a ∈ A).

i i
i
La preuve du résultat suivant est semblable et omise.
Proposition 2.38. Soit X = (x , ..., x ) une suite de IR et soit L = (ℓ , ..., ℓ ). Alors X

(1) (p) p
converge vers L si et seulement si pour tout i = 1...p x → ℓ .

n n n 1 p n
(i)
n i
Proposition 2.39. Soient A ⊂ IR , p : IR → IR la i-ème projection dénie par p (x , ..., x ) = x .

n n
Alors A est bornée dans IR si et seulement si pour tout i, p (A) est bornée dans IR.
i i 1 n i
n
i
11 Compacité dans les e.m.

Dénition 2.23. Soit K une partie de (X, d) e.m. K est dite (séquentiellement) compacte si elle
possède la propriété suivante (dite de Bolzano-Weierstrass) : De toute suite de K, on peut extraire
une suite convergente dans K.
Rappel 2.11 . Dans IR le théorème de Bolzano-Weierstrass indique que toute suite bornée admet une
sous-suite convergente et donc que tout fermé borné est compact.
Proposition 2.40. Un compact K d'un espace métrique X est un fermé borné de X . Un sous-
ensemble fermé d'un compact est compact. Le produit de 2 espaces compacts est compact.
Démonstration. K
1. Un compact (u ) l E
est fermé, car si une suite n converge vers dans , elle
admet une sous-suite convergeant vers k ∈ K, dont la limite est nécessairement l=k (propo-
sition 2.4), donc l ∈ K.
2. On montre par contraposée qu'un ensemble non borné A ne peut pas être compact. Si A
non-borné, soit xn ∈ A tel que d(xn , y) ≥ n, si une suite extraite xϕ(n) → x convergeait, elle
serait bornée, ce qui n'est pas le cas car d(xϕ(n) , y) ≥ ϕ(n) →n→∞ ∞.
3. Si F ⊂K avec K compact, F fermé, une suite de F admet une sous suite convergeant dans
K par compacité, donc sa limite est dans F par fermeture, d'où F compacte.
4. Si K, L (xn , yn ) ∈ K × L, on extrait une suite (xϕ(n) ) conver-

sont compacts, pour une suite
gente dans K , puis on réextrait (yϕ(ψ(n)) ) convergente dans L (et a fortiori (xϕ(ψ(n)) ) est aussi
convergente) donc (xϕ(ψ(n)) , yϕ(ψ(n)) ) converge dans K × L.
Exemple 2.17 .
F = {(x, y) ∈ IR2 , xy = 1} est fermé mais pas compact. En eet, si f (x, y) = xy
Soit
2 −1
est polynomiale donc continue IR → IR donc F = f ({1}) est fermé comme image réciproque d'un
fermé par une application continue. Mais F n'est pas compact car pas borné. xn = (1/n, n) ∈ F et
||xn ||∞ = n → ∞.
32
Remarque . 0
2.12 En général dans un evn un fermé borné n'est pas toujours compact. Dans C ([0, 1], IR),
n
montrons que la boulde unité fermée n'est pas compacte. fn (x) = x vérie ||fn ||∞ = 1, mais comme
fn (x) → f (x) (on dit converge simplement vers f ) avec f (x) = 0 si x < 1, f (1) = 1, donc f non
continue. Toute suite extraite de f devrait converger vers cette limite qui n'est pas continue, donc
elle ne peut pas converger dans C 0 ([0, 1], IR) vers cette limite qui n'est pas dans C 0 ([0, 1], IR). En
général, on peut montrer que les boules fermées d'evn sont compactes si et seulement si l'evn est de
dimension nie, on montre une implication ci-dessous.
Théorème 2.41. Si u : E → F est continue et K ⊂ E est compacte alors u(K) est compacte.
Démonstration. Soit yn une suite de u(K) donc yn = u(xn ) ,avec (xn ) suite de K , on extrait donc
une suite xϕ(n) convergeant vers x ∈ K . Par continuité, la suite extraite yϕ(n) = u(xϕ(n) ) → u(x) ∈
u(K).
Corollaire 2.42. (Thm de Weierstrass) Si K ⊂ X e.m. est compacte et f : K → IR est continue,
alors la fonction f est bornée et atteint ses bornes : ∃x , x ∈ K, ∀x ∈ Kf (x ) ≤ f (x) ≤ f (x ).
0 1 0 1
Démonstration. f (K) f
est compacte donc fermée et bornée. Donc f (K)
est bornée, et le contient son
sup et son inf (par fermeture) c'est-à-dire, il existe y0 , y1 ∈ f (K) y0 = inf x∈K f (x), y1 = supx∈K f (x).
Finalement yi = f (xi ) avec xi ∈ K .
Corollaire 2.43. Soit X, K deux espaces métriques avec K compact et f : K → X une bijection
continue, alors f est une homéomorphisme (c'est-à-dire f est continue et X est aussi compacte).
−1
Démonstration. f Comme F ⊂K
bijective, pour un fermé (f ) (F ) = f (F )
, donc un compact,
−1
−1 −1
est
l'image directe du compact F dans X , donc est compact donc fermé. f envoie donc un fermé sur
un fermé, donc est continue par caractérisation topologique de la continuité (Proposition 2.22).
Théorème 2.44. Dans un evn de dimension nie, les compacts sont exactement les fermés bornés.
Démonstration. Il reste à montrer que les fermés bornés sont compacts. D'après le théorème 2.34 un
n n −1
isomorphisme linéaire u de E sur IK est continu de (E, ||.||) sur (K , ||.||∞ ), et u également. u(K)
−1
est fermé comme image réciproque d'un fermé par u continue, u(K) est borné comme image d'un
n
borné par une application lipschitzienne. Donc L = u(K) est un fermé borné de (K , ||.||∞ ). Il sut
−1
de voir que c'est un compact, car alors K = u (L) est compact comme image continue d'un compact
(1) (n) (i)
(theorème 2.41). Soit (xp ) = (xp , ..., xp ) une suite de L, par dénition de la norme (xp ) sont bornés,
elles admettent donc, par le théorème de Bolzano-Weierstrass dans IK, une sous-suite simultanément
(i) (i) (1) (n) (i)
convergente. xϕ(p) → x Donc si x = (x , ..., x ), on a ||xϕ(p) − x|| = maxi=1...n |xϕ(p) − x(i) | → 0
et comme L est fermé ; x ∈ L ce qui conclut.
Exemple 2.18 . Soit

2
IR
−1
2 2
x + y 2 /2 = 1} est compact. En eet, si f (x, y) = x2 + y 2 /2
K = {(x, y) ∈
est polynomiale donc continue IR → IR donc F = f ({1})√ est fermé comme image réciproque d'un
fermé par une application continue. De plus K ⊂ B||.||∞ ,F (0, 2) donc K est borné, donc fermé borné
2
dans IR de dimendion nie, donc K est compact.
Exemple 2.19 .g : K → IR dénie par g(x, y) = x2 + y 2 g est continue donc atteint ses bornes
Soit
sur K compact. En eet g est la distance euclidienne à l'origine, il est facile de voir qu'elle atteint
√
son maximum 2 en (0, ± 2) sur K et son minimum 1 en (±1, 0) sur K . Le théorème des extremas
liés permettra de retrouver ce résultat pour des g et des K plus généraux.
Théorème 2.45. (de Heine) Toute fonction continue f sur un compact K ⊂ X est uniformément
continue.
33
Démonstration. 2
Soit g : (x, y) → d(f (x), f (y)) de K 2 dans IR elle est continue (pour la
2
distance
produit sur X par composition) donc g(K ) est compact. Soit ϵ > 0 reste à trouver un δ de
continuité uniforme.
A = {(x, y) ∈ K 2 | d(f (x), f (y)) ≥ ϵ} = g −1 ([ϵ, +∞[)

est fermé dans K2 donc compact. Donc l'application continue (x, y) 7→ d(x, y) atteint sa borne
inférieure m. On a m ̸= 0 car sinon on aurait un (x, x) ∈ A, ce qui n'est pas possible vu ϵ > 0.
Finalement si δ > 0 est tel que δ < m, si d(x, y) ≤ δ , on a (x, y) ̸∈ A, donc d(f (x), f (y)) < ϵ.
11.1 Complément : un résultat reliant complétude et compacité (faculta-

tif)
Proposition 2.46. Tout espace métrique compact X est complet.
Démonstration. Soit (xn ) une suite de Cauchy de X, elle admet par compacité une suite extraite
convergente, donc elle converge (proposition 2.5).
Dénition 2.24. Un espace métrique (X, d) est précompact si pour tout ϵ > 0, X peut être couvert
par un nombre ni de boules ouvertes de rayon ϵ.
On rappelle le résultat suivant (cf. e.g. Zuily-Quéelec Th II.1 p135 ou Gourdon d'Analyse p 32)
ou la proposition A.7.
Proposition 2.47. Un espace métrique X est compact si et seulement si il est précompact et complet.
11.2 Complément : Compacité topologique (facultatif)

On rappelle le résultat suivant (cf. e.g. Gourdon d'Analyse Thm 1 p 28)
Théorème 2.48 Pour un ensemble K d'un espace métrique X est

.
compact, si et[seulement si, pour tout (U ) est un recouvrement de K par des ouverts U de [
X , au
(Propriété de Borel-Lebesgue)
sens où K ⊂ U alors K admet un sous-recouvrement ni : il existe I ⊂ I ni tel que K ⊂ U .

i i∈I i
i 0 i
i∈I i∈I0
En passant au complémentaire et à la contraposée, on obtient aussi la version équivalente :
Théorème 2.49. Pour un ensemble K d'un espace métrique X est compact, si et seulement si,
pour
\ tout (F ) est un fermé de K , si pour toute intersection
\ nie (i.e. avec I ni) est non-vide
F ̸= ∅ alors l'intersection complète est aussi non-vide F ̸= ∅.
i i∈I 0
i i
i∈I0 i∈I
12 Intégrale de Riemann à valeur Espace de Banach

Nous référons par exemple au Gourdon d'Analyse (chapitre 3 secion 1) pour cette section. Soit
F un evn complet. Soit I = [a, b] ⊂ IR un segment. On rappelle les dénitions :
Dénition 2.25. subdivision [a, b] (ai )i=0,··· ,n a = a0 < a1 < · · · <

continue par morceaux
Une de est suite nie de la forme
an = b. Une fonction sur I est une fonction f : I → F telle qu'il existe
une subdivision (ai )i=0,··· ,n , telle que pour i ∈ [[0, n − 1]], chaque restriction f]ai ,ai+1 [ est continue et
admette des limites en ai , ai+1 . Une fonction f : I → F est dite en escalier
si il existe une subdivision
(ai )i=0,··· ,n , telle que pour i ∈ [[0, n − 1]], f]ai ,ai+1 [ est constante.
34
On dénit E = CM (I, F ) l'ensemble des fonctions continues par morceaux sur I à valeur F .
Comme chaque prolongement par continuité de f]ai ,ai+1 [ est continue sur un compact [ai , ai+1 ], donc
bornée, les fonctions continues par morceaux sont bornées. On note D⊂E l'ensemble des fonctions
en escaliers.
E est donc un Evn (PAS complet) pour la norme de la convergence uniforme, si f ∈E :
||f ||E = sup ||f (t)||F .

t∈I
On va utiliser le théorème suivant de prolongement des applications linéaires continues pour

dénir l'intégrale à valeur dans F. C'est une application immédiate du Théorème 2.27 :
Proposition 2.50. Toute application linéaire continue u d'un sous-espace vectoriel dense D d'un
evn E vers un evn complet F se prolonge en une unique application linéaire continue v : E → F ,
ayant la même constante de lipschitzianité que u.
Démonstration. uComme K
est continue donc -lipschitzienne (par proposition 2.29) donc uniformé-
ment continue, l'unique prolongement est donné par le Théorème 2.27.
xn → x, yn → y en passant à la limite dans la relation u(αxn + βyn ) = αu(xn ) + βu(yn ),
Si on
déduit que v est linéaire et avec ||u(xn −yn )|| ≤ K||xn −yn ||, on déduit que v est K -lipschitzienne.
Pour une fonction en escalier ϕ : [a, b] → F de subdivision (ai )i=0,··· ,n . On dénit
Z Xn a + a
i−1 i
I(ϕ) = ϕ(t)dt = (ai − ai−1 )ϕ .
[a,b] i=1
2
I est une application linéaire continue, car par l'inégalité triangulaire
n
X a + a
i−1 i
||I(ϕ)|| ≤ |ai − ai−1 | ϕ ≤ ||ϕ||E |b − a|.
i=1
2 F
Comme les fonctions en escalier sont denses dans les fonctions continues par morceaux (exo. TD), la
proposition précédente permet d'étendre l'intégrale comme quand F = IR et on a :
Dénition 2.26. L'intégrale des fonctions continues par morceaux CM (A, F ) est l'unique
Rb Rb
prolon-
gement linéaire continu de l'intégrale des fonctions en escaliers, noté

a
dtf (t) = a
f (t)dt.
Proposition 2.51. (Inégalité triangulaire) || R a

b
dtf (t)||F ≤
Rb
a
dt||f (t)||F .
Démonstration.
n
X a + a Z b
i−1 i
||I(ϕ)||F ≤ |ai − ai−1 | ϕ = ||ϕ(t)||F dt
i=1
2 F a
pour ϕ en escalier et on prolonge par continuité.
On a toutes les propriétés usuelles, Chasles, linéarité, en particulier si F = IRn et f = (f1 , ..., fn )
Rb Rb Rb
a
f (t)dt = ( a f1 (t)dt, ..., a fn (t)dt).
35
12.1 Rappel sur les Intégrales impropres
Dénition 2.27. Pour une fonction f continue sur un intervalle I → IR qui n'inclut pas toutes ses
bornes ou qui n'est pas borné, on dénit l'intégrale impropre de la manière suivante :
1. Dans le cas I = [a, b[ avec a < b, b ∈ IR ∪ {+∞}

Z b Z c
f (x)dx = lim f (x)dx
a c↗b a
2. Dans le cas I =]a, b] avec a < b, a ∈ IR ∪ {−∞}

Z b Z b
f (x)dx = lim f (x)dx
a c↘a c
3. Dans le cas I =]a, b[ avec a < b, a ∈ IR ∪ {−∞}, b ∈ IR ∪ {+∞} on prend a<c<b et on

pose
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c
Dans tous ces cas, on dit que l'intégrale est convergente si la limite existe et est nie.
Dans tous les cas, on s'occupera surtout du cas I = [a, b[ puisque le cas I =]a, b] est similaire en
remplaçant f par x 7→ f (−x)
Le cas le plus important est le cas suivant (car on va disposer de théorèmes de comparaison avec
des fonctions positives de références) :
Dénition 2.28. Pour une fonctionR f continue sur un intervalle I (comme dans la dénition précé-
dente) est dite intégrable sur I si

b Rb
a
|f (x)|dx converge. Dans ce cas on dit aussi que a f (x)dx est
absolument convergente.
Exercice . 2.4 Convergence et valeur de
Z 1
1
√ dx.
0 x
R1 √ √
La limite innie est en 0. Donc Soit t>0 on Calcule √1 dx = [2 x]1t = 2 − 2 t. La limite en
t x
t→0 est nie donc l'intégrale converge et vaut 2.
12.2 Exemples de référence (à connaître TRES BIEN)

R∞ R A −x
1.
0
e−x dx
converge et vaut 1. En eet,
0
e dx = 1 − e−A →A→∞ 1.
converge ssi a > 0, et vaut alors 1/a.
R ∞ −ax
Plus généralement,
0
e dx
converge si et seulement si (intégrale de Riemann) et vaut
R∞ 1
2.
1 tα
dt α>1
Z ∞
1 1
α
dt = , α > 1,
1 t α−1
Z ∞
1
dt = +∞, α ≤ 1.
1 tα
RA A−α+1 −1
En eet, si α ̸= 0,
1
1 tα
dt = −α+1 et pour α > 1, A−α+1 →A→+∞ 0, tandis que pour α<1
−α+1
A →A→+∞ +∞
RA 1
Si α = 1,
1 t
dt = ln(A) →A→+∞ +∞
36
converge si et seulement si α < 1 (intégrale de Riemann) et vaut
R1 1
3.
0 tα
dt
Z 1
1 1
α
dt = ,α < 1
0 t 1−α
Z 1
1
dt = +∞, α ≥ 1
0 tα
.
R1 1−a−α+1
En eet si α ̸= 0,
1
a tα
dt = −α+1 et pour α > 1, a−α+1 →a→0 +∞, tandis que pour α <1
a−α+1 →a→0R 1 01
Si α = 1,
a t
dx = | ln(a)| →a→∞ ∞.
R∞ 1
4.
0 tα
dt = +∞ diverge toujours pour tout α ∈ IR(en combinant les 2 points précédents).
12.3 Théorèmes de comparaison

Le contexte est le suivant : on se donne une fonction continue f : I = [a, b[→ IR et on étudie la
Rb
nature de l'intégrale impropre
a
f (x)dx
La méthode la plus simple consiste à chercher une fonction convenable continue et positive g :
I = [a, b[→ [0, ∞[ et de comparer f à g. Les trois résultats de base à utiliser sont les suivants (avec
C>0 une constante).
Théorème 2.52. Théorème de comparaison .

1. Si |f (x)| ≤ Cg(x), ∀x ∈ [a, b[, et siR g(x)dx converge, alors
R b R
f (x)dx converge (absolument).
b
2. Si f (x) ≥ Cg(x), ∀x ∈ [a, b[ et si g(x)dx = +∞ alors f (x)dx = +∞.

a a
b R b
a a
13 Espaces métriques séparables

Dénition 2.29. dense E Ā = E
Une partie A est dite dans si . Un ensemble est dit séparable si il
admet un sous-ensemble au plus dénombrable dense (ou autrement dit une suite dense).
Lemme 2.53. Un sous-ensemble F d'un espace métrique séparable est séparable.

Démonstration. F
On peut supposer non-vide, sinon, c'est évident (la partie vide donc nie est
dense). On xe donc x0 ∈ F
Soit un am,n ∈ B(um , 1/n) ∩ F si cet ensemble est non-vide,
une suite dénombrable dense. Soit
et sinon on pose am,n = x0 . La famille {am,n , m, n ∈ IN} est nie ou dénombrable et dense car si
x ∈ F il existe d(um , x) < 1/2n donc am,2n existe car B(um , 1/2n) ∩ F est non vide et par inégalité
triangulaire d(um , am,2n ) < 1/n.
Proposition 2.54. (IRn , ||.||∞ ) est séparable.

Démonstration. On a vu que Q l
n
est dénombrable comme produit d'ensembles dénombrables. Mon-
⌊px1 ⌋
n
trons qu'il est dense dans IR . En eet si x = (x1 , ..., xn ) on pose xp = (
p
, ..., ⌊pxpn ⌋ ) avec ⌊x⌋ la
partie entière de x. Donc ⌊pxi ⌋ ≤ pxi ≤ ⌊pxi ⌋ + 1 et
⌊pxi ⌋ 1
− xi ≤
p p
n n n n
donc ||xp − x||∞ ≤ 1/p →p→∞ 0. Donc vu xp ∈ Q
l , x ∈ Q
l . Comme x est arbitraire. IR ⊂Q
l
CQFD.
Exercice . 2.5 Montrer que Q

l
c
est dense dans IR.
37
Chapitre 3
Ensembles et fonctions convexes,
Introduction à l'optimisation
Vous avez vu en L2 qu'une fonction C 1 f qui atteint un minimum sur un ouvert en x satisfait
2
une condition nécessaire du première ordre ∇f (x) = 0 et si f est C on peut garantir que c'est un
minimum local si sa hessienne est dénie positive.
Il reste les questions : comment avoir un minimum global ? comment avoir unicité du minimum ?
C 2 , sera équivalente
Une réponse va être obtenue en étudiant une notion, qui, dans le cas des fonctions
à une positivité globale de la hessienne. L'avantage est qu'on peut trouver une dénition : la notion
de fonction convexe, sans hypothèse de dérivabilité et qui va être robuste et permettre d'obtenir aussi
des critères d'optimisation du premier ordre, sur des ensembles eux aussi convexes (pas forcément
ouverts).
On suppose donc que E est un espace vectoriel (e.v.) sur IR.
1 Ensembles Convexes
Soit x, y ∈ E , on appelle segment d'extrémité x et y la partie
[x, y] = {λx + (1 − λ)y, λ ∈ [0, 1]}.
On retrouve bien sûr la dénition usuelle du segment dans IR. (avec la notation inhabituelle
[−1, −2] = [−2, −1])
Dénition 3.1. Un ensemble C⊂E est dit convexe si ∀x, y ∈ C, [x, y] ⊂ C .
Par convention , C = ∅ est convexe même si les convexes intéressants sont les convexes non-vides...
Proposition 3.1. Si E est un e.v.n., les boules (ouvertes et fermés) sont des convexes.
Démonstration. Considérons le cas des boules ouvertes. Soient x, y ∈ B(a, r), z = λx + (1 − λ)y ,
λ ∈ [0, 1].
Par l'inégalité triangulaire et homogénéité, on a :
||z − a|| = ||λ(x − a) + (1 − λ)(y − a)|| ≤ |λ|||x − a|| + |1 − λ|||y − a|| < |λ|r + |1 − λ|r = r.
Donc z ∈ B(a, r). Le cas des boules fermées est similaire.
38
Exemple . 3.1 On pose ||(x, y)||1/2 = (|x|1/2 + |y|1/2 )2 . On note B = {(x, y) ∈ IR2 : ||(x, y)||1/2 ≤ 1}.
On remarque que (1, 0), (0, 1) ∈ B , (1/4, 1/4) ∈ B mais (1/2, 1/2) ̸∈ B donc B n'est pas convexe et
2
|| · ||1/2 n'est PAS une norme sur IR .
Exercice . 3.1 Montrer que les ensembles convexes de IR sont exactement les intervalles.
Le résultat suivant est laissé en exercice.
Proposition 3.2. Si C est convexe, alors son adhérence C et son intérieur Int(C) sont convexes.
Une intersection (nie ou innie) d'ensembles convexes est convexe. Si C ⊂ E, C ⊂ F sont
convexes, alors C × C est convexe dans E × F .
1 2
1 2
1.1 Cônes tangents et normaux dans IRn

On suppose E = IRn (ou un espace préhilbertien comme au dernier chapitre pour avoir un produit
n
X
scalaire). On rappelle ⟨f, x⟩ = fi xi , pour f, x ∈ E .
i=1
Les deux ensembles suivant seront importants pour formuler des conditions pour des problèmes
de minimisation sous contrainte. On rappelle que pour A, B ⊂ E, C ⊂ IR, x ∈ E , A + B = {a + b :
a ∈ A, b ∈ B}, CA = {ca, c ∈ C, a ∈ A}, A − x = {a − x : a ∈ A}, x + A = {a + x : a ∈ A}.
Dénition 3.2. Le cône tangent (au sens de l'analyse convexe) du convexe S⊂E e.v.n. au point
x∈S est
u−x
TS (x) := { , u ∈ S, s > 0} = IR∗+ (S − x),
s
Le cône normal est son polaire, c'est à dire le cône convexe fermé :
NS (x) := {f ∈ E : ∀u ∈ S, ⟨f, u − x⟩ ≤ 0} = {f ∈ E : ∀v ∈ TS (x)⟨f, v⟩ ≤ 0}.
Exercice . L
⊥
3.2 Si E
est un s.e.v de (de dimension nie), a ∈ L. Montrer que TL (a) = L et NL (a) =
L = {y ∈ E : ⟨y, a⟩ = 0∀y ∈ L}, est l'orthogonal de L.
Exercice . S 3.3 Si a ∈ Int(S)
convexe et . Montrer que TS (a) = E et NL (a) = {0}.
2 Fonctions convexes
Il est pratique de considérer des fonctions f : E →] − ∞, +∞] = IR ∪ {+∞}. Dans ce cas on parle
de domaine de f :
D(f ) = {x ∈ E : f (x) < ∞}.

Les propriétés que l'on considère dans cette section vont être déterminées par l'ensemble des
valeurs au dessus du graphe de f, que l'on appelle épigraphe de f :
Epi(f ) = {(x, λ) ∈ E × IR : f (x) ≤ λ}.
On utilise les conventions ∞+∞=∞ et λ.∞ = ∞ si λ > 0, 0.∞ = 0.

Dénition 3.3. Soit C un ensemble convexe.
1. Une fonction f : C →] − ∞, +∞] est dite convexe si pour tout λ ∈]0, 1[, x, y, ∈ C ,
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y).
39
2. Une fonction f : C →] − ∞, +∞] est dite strictement convexe si pour tout λ ∈]0, 1[, x, y, ∈ C ,
avec x ̸= y
f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y).
3. Une fonction f : C → [−∞, +∞[ est dite concave si −f est convexe.
Exemple . 3.2 Une fonction ane f (x1 , ..., xn ) =

Pn
i=1 ai xi + b est convexe et concave mais pas
strictement convexe ! Une norme sur E est convexe.
Remarque . 3.1 Si f est convexe, alors C ∩ D(f ) est convexe car si f (x) < +∞, f (y) < ∞ alors
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) < ∞.
On peut donc toujours remplacer soit C par E soit C par C ∩ D(f ) selon votre goût (pour les
fonctions innies ou les ensembles convexes).
Proposition 3.3. Soit E un e.v. et f : C →] − ∞, ∞].

1. f est convexe si et seulement si Epi(f ) est convexe
1'. Si f est convexe alors pour tout t ∈ IR, f (] − ∞, t]) est convexe. La réciproque est fausse.
−1
2. Si µ > 0, f, g convexes alors µf + g est convexe. De plus, elle est aussi strictement convexe
si f ou g l'est.
3. Si f , i ∈ I sont convexes alors l'enveloppe supérieure f (x) = sup f (x) est convexe.
4. (facultatif) f est convexe ssi g : E →] − ∞, +∞], dénie par g(x) = f (x) si x ∈ C et
i i∈I i
g(x) = +∞ sinon, est convexe.

5. Si f est strictement convexe, alors f a au plus un minimum sur C .
Le dernier point donne la première relation simple des fonctions convexes à l'optimisation.
Démonstration. Pour (1), l'énoncé est vide si f (x) ou f (y) = ∞. Soit donc (x, t1 ), (y, t2 ) ∈ Epi(f )
(comme on veut ti < ∞ cela utilise la réduction précédente). On remarque que (λx + (1 − λ)y, λt1 +
(1 − λ)t2 ) ∈ Epi(f ) ssi f (λx + (1 − λ)y) ≤ λt1 + (1 − λ)t2 .
Si les épigraphes sont convexes, cette propriété est vériée et donc en prenant l'inmum sur t1 , t2
(qui donne f (x), f (y)) on a le résultat. Si f vérie l'inégalité, on utilise f (x) ≤ t1 , f (y) ≤ t2 pour
conclure :
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) ≤ λt1 + (1 − λ)t2 .
(1)' On montre la convexité de D = {x : f (x) ≤ t} comme ci-dessus. Soit x, y ∈ D alors pour
λ ∈ [0, 1] : f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) ≤ λt + (1 − λ)t = t. Donc λx + (1 − λ)y ∈ D. Par
−1
contre si g = 1[0,∞[ alors si t < 0 , g (] − ∞, t]) = ∅, si 0 ≤ t < 1 , g −1 (] − ∞, t]) =] − ∞, 0[ et sinon
−1
pour t ≥ 1, g (] − ∞, t]) = IR et ce sont 3 intervalles donc 3 ensembles convexes. Mais g n'est pas
convexe g(0) = 1 > 1/2g(−1) + 1/2g(1) = 1/2.
(2) est évident en utilisant l'inégalité :
µf (λx + (1 − λ)y) + g(λx + (1 − λ)y) ≤ µ(λf (x) + (1 − λ)f (y)) + (λg(x) + (1 − λ)g(y))
= (λ(µf + g)(x) + (1 − λ)(µf + g)(y)).
(3) vient de la stabilité des convexes par intersection et de Epi(f ) = ∩i∈I Epi(fi ).
(4) est évident car Epi(f ) = Epi(g).
(5) si x ̸= y sont deux points atteignant le minima, f ((x + y)/2) < (f (x) + f (y))/2 contredisant
la minimalité.
40
Une propriété importante des fonctions convexes est le fait qu'on peut les caractériser en terme
d'accroissements :
Proposition 3.4. Soit f : E →] − ∞, +∞] une fonction. f est convexe si et seulement si pour tout
x, h ∈ E la fonction ∆ f (t) :=
x,h est croissante sur IR .
f (x+th)−f (x)
t
∗
+
Démonstration. g(t) = ∆ f (t) =

Il sut de noter que x,h
f (x+th)−f (x)
t
est croissante si et seulement si
g(t) ≤ g(s) pour 0<t<s si et seulement si on a l'inégalité de convexité :
t t t t
f (x + th) = f ( (x + sh) + x(1 − )) ≤ f (x + sh) + f (x)(1 − ).
s s s s
Donc la convexité de f implique la croissance énoncée et réciproquement en prenant s=1 on écrit
toute paire x, y sous la forme y =x+h et l'inégalité ci-dessus se réécrit en l'inégalité dénissant la
convexité de f :
f ((1 − t)x + ty) = f (x + th) ≤ f (x + h)t + f (x)(1 − t) = f (y)t + f (x)(1 − t).
Cela implique une régularité minimale des fonctions convexes :
Corollaire 3.5.Si f : E →] − ∞, ∞] est convexe, pour tout x ∈ D(f ) et tout h ∈ E, la dérivée

directionnelle existe dans [−∞, ∞] au sens où la limite suivante existe et vaut :
Dh′ f (x)
f (x + th) − f (x) f (x + th) − f (x)

Dh′ f (x) := lim+ = inf .
t→0 t t>0 t
Démonstration. Par la proposition précédente g(t) = f (x+th)−f (x)

t
est croissante donc admet une limite
pour t → 0+ qui coïncide avec l'inmum.
2.1 Calcul des cônes normaux courants

m
Soient g1 , ..., gn des fonctions convexes C1 dénies sur IR → IR tel qu'il existe x0 avec gi (x0 ) < 0
pour tout i.
Soit la contrainte :
C = {x ∈ IRm : ∀i ∈ {1, ..., n}, gi (x) ≤ 0}.
On sait que chaque gi−1 (] − ∞, 0])
est convexe comme image réciproque d'un intervalle borné
n −1
supérieurement par une application convexe. Par intersection, on sait donc que C = ∩i=1 gi (]−∞, 0])
est aussi convexe.
Théorème 3.6. (admis, cf Section B.1) Soit x ∈ C tel que :

1. les l premières contraintes sont actives, c'est à dire : g (x) = ... = g (x) = 0
2. les autres contraintes ne sont pas actives, c'est à dire g (x) < 0, ...g (x) < 0
1 l
Si l = 0, on a N (x) = {0} et sinon, le cône normal à C en x est donné par

l+1 n
C
( l )
X
NC (x) = λi ∇gi (x), λi ≥ 0 .
i=1
41
Exemple . 3.3 SoitA = {(x, y) ∈ IR2 : x ≥ y ≥ 0, }.
1
Si on pose g1 (x, y) = y − x, g2 (x, y) = −y qui
sont linéaires donc convexes et C , on a :
A = {(x, y) ∈ IR2 : g1 (x, y) ≤ 0, g2 (x, y) ≤ 0}
Calculons NA (0) le cône normal en 0 = (0, 0).

On a g1 (0, 0) = 0 = g2 (0, 0) donc toutes les contraintes sont actives.
On calcule donc ∇g1 (0, 0) = (−1, 1), ∇g2 (0, 0) = (0, −1). D'après le théorème, on a :
NA (0) = IR+ (−1, 1) + IR+ (0, −1).
Exercice . 3.4 1. Pour A de l'exemple précédent, si a = (x, x) pour x > 0. Montrer que NA (a) =
IR+ (−1, 1).
2. Pour b = (x, 0), x > 0. Montrer que NA (b) = IR+ (0, −1).
3. Y-a-t-il d'autres valeurs de NA (c) et si oui, pour quels points c ∈ A?
2.2 Fonctions convexes sur IR

Soit I un intervalle de IR. Pour une fonction f : I → IR eta ∈ I , on considère la fonction
f (x) − f (a)
(taux d'accroissement de f en a) ∆a f dénie par ∆a f (x) = pour tout x ∈ I \ {a}. La
x−a
proposition 3.4 se reformule sous la forme :
Proposition 3.7. Une fonction f : I → IR est convexe si et seulement si pour tout a ∈ I , la fonction
∆a f est croissante sur I \ {a}.
On en déduit les inégalités suivantes (inégalité des pentes, cf dessin en cours) sur une fonction f :
Proposition 3.8. Une fonction convexe f : I → IR vérie l' inégalité des pentes :
f (b) − f (a) f (c) − f (a) f (c) − f (b)
∀a, b, c ∈ I, a < b < c ⇒ ≤ ≤ .
b−a c−a c−b
Théorème 3.9. Soit I un intervalle ouvert de IR, et f : I → IR une fonction convexe. Alors pour tout
, admet des dérivées à droite et à gauche en a. On a pour tout x ∈ I : f (x) ≥ f (a)(x−a)+f (a)
a∈I f ′
et . En particulier, il existe une fonction ane g telle que g(a) = f (a) et

f (x) ≥ fg′ (a)(x − a) + f (a)
d
pour tout . De plus, si a < b sont dans I , on a f (a) ≤ f (a) ≤ f (b).

g(x) ≤ f (x) x∈I ′
g
′
d
′
g
Démonstration. a ∈ I Soit . Dans le cas d'une fonction à une variable, le corollaire 3.5 implique
l'existence de dérivées à droites et à gauches (pour l'instant peut-être innies). Dans l'inégalité des
+ −
pentes en faisant c → b ou a → b , on obtient :
f (b) − f (a)
−∞ < ≤ fd′ (b),
b−a
f (c) − f (b)
fg′ (b) ≤ < +∞.
c−b
Pour a < b, 0 < ϵi < (b − a)/2, l'inégalité des pentes appliquée aux points a ≤ a + ϵ1 < b − ϵ2 < b
donne :
42
f (a + ϵ1 ) − f (a) f (b − ϵ2 ) − f (a + ϵ1 ) f (b − ϵ2 ) − f (b)
≤ ≤
ϵ1 (b − a − ϵ1 − ϵ2 ) −ϵ2
et en passant à la limite ϵ1 → 0+ ou ϵ2 → 0+ puis les deux, on obtient :
f (b − ϵ2 ) − f (b)
fd′ (a) ≤ ,
−ϵ2
f (a + ϵ1 ) − f (a)
≤ fg′ (b),
ϵ1
fd′ (a) ≤ fg′ (b).
Donc fd′ (a) < +∞, fg′ (a) > −∞, ce qui termine la preuve des dérivabilités à droite et à gauche, et
on a l'inégalité attendue.
De plus, la formulation comme inmum, dans le corollaire 3.5, montre que pour tout x > a
f (x) − f (a) ′
que ≥ fd (a) et donc f (x) ≥ fd′ (a)(x − a) + f (a). De même, pour tout x < a on a
x−a
f (x) − f (a)
≤ fg′ (a) ; en multipliant par x − a (qui est négatif !) on a donc que pour tout x < a
x−a
f (x) ≥ f (a) + fg′ (a)(x − a).
′ ′ − +
De plus, fg (b) ≤ fd (b) (en passant aux limites a → b , c → b dans l'inégalité des pentes) ;
′ ′
par conséquent, pour x < a fg (a)(x − a) ≥ fd (a)(x − a), et on voit nalement que l'inégalité
f (x) ≥ fd′ (a)(x − a) + f (a) est valide pour tout x ∈ IR. Le même raisonnement s'applique pour
montrer que l'autre inégalité est vraie pour tout x ∈ IR.
Corollaire 3.10. Soit I un intervalle ouvert de IR, alors une fonction convexe f : I → IR est
continue.
Exercice . 3.5 Trouver une fonction convexe f : [0, 1[→ IR qui n'est pas continue en {0}.
Proposition 3.11. Si E = IR et f est dérivable sur un ouvert convexe U ⊂ E (donc un intervalle
ouvert) alors f est convexe si et seulement si f est croissante.
′
Démonstration. ⇒ f
) Supposons
convexe, l'inégalité qu'on a montrée au (2) du théorème précédent
s'écrit (f ′ (u) − f ′ (v))(u − v) ≥ 0 ′ ′ ′
donc (f (u) − f (v)), (u − v) ont même signe et f est croissante.
′ ′ ′ ′
On peut alternativement utilisé pour a < b, f (a) = fd (a) ≤ fg (b) = f (b) grâce à l'inégalité vue au
théorème 3.9.
⇐) Réciproquement si f ′ croissante, montrons que f convexe, on veut voir f (λa + (1 − λ)b) ≤
λf (a)+(1−λ)f (b) pour a < b, λ ∈]0, 1[. Par l'égalité des accroissements nis, la pente f (λa+(1−λ)b)−f
(1−λ)(b−a)
(a)
′ f (b)−f (λa+(1−λ)b) ′
est atteinte par f en un point de ]a, λa + (1 − λ)b[, et de même est atteinte par f
(λ(b−a)
en un point de ]λa + (1 − λ)b, b[ donc par croissance de la dérivée :
f (λa + (1 − λ)b) − f (a) f (b) − f (λa + (1 − λ)b)

≤
(1 − λ)(b − a) λ(b − a)
1 1 f (a) f (b)
⇐⇒ f (λa + (1 − λ)b)( + )≤ +
(1 − λ)(b − a) λ(b − a) (1 − λ)(b − a) λ(b − a)
1 f (a) f (b)
⇐⇒ f (λa + (1 − λ)b)( )≤ + .
λ(1 − λ) (1 − λ) λ
Ceci conclut.
43
3 Propriétés diérentielles des fonctions convexes.
3.1 Rappel sur la diérentiabilité (au sens de Fréchet)
On rappelle que pour E, F des e.v.n. l'ensemble des applications linéaires continues L(E, F ) est
un e.v.n. avec la norme d'opérateur (dite aussi norme subordonnée) |||f ||| = sup||x||E ≤1 ||f (x)||F .
Dénition 3.4. Soit E, F des e.v.n., U ⊂ E un ouvert, f : U → F est diérentiable (au sens de
Fréchet) en x si il existe T ∈ L(E, F ) notée df (x) telle que
||f (x + h) − f (x) − df (x)(h)|| = o(||h||), si ||h|| → 0.
f est C 1 (ou continuement diérentiable) sur U si f est diérentiable en tout x ∈ U et df : U →

L(E, F ) est continue. On note aussi Dh f (x) = df (x)(h)
f est C 2 si f est C 1 et df est aussi C 1 . On note d2 f (x)(h, k) = Dk (Dh f )(x).
On rappelle que si g : U → V ⊂ F, f : V → Z sont diérentiables, alors f ◦g aussi et d(f ◦g)(x) =
df (g(x)) ◦ dg(x). De plus si Z = IR et f a un minimum local en x ∈ V avec V ouvert, alors df (x) = 0.
Remarque . 3.2 Il est important de noter que df (x) est une application linéaire, donc df (x)(h) est
linéaire en h, mais pas forcément en x. Pour insister sur ce point, on note parfois de façon équivalente :
df (x)(h) ≡ df (x).h ≡ df (x).[h]
Dans le cas le plus fréquent pour nous où E = IRn , F = IR, si f est diérentiable, alors elle admet
∂f ∂f
des dérivées partielles, le gradient de f en a est noté ∇f (a) = ( ∂x1
(a), ..., ∂x n
(a)). Alors, on a :
n
X ∂f
df (a)(h) = ⟨∇f (a), h⟩ = (a)hj .
j=1
∂x j
3.2 Caractérisations diérentielles des fonctions convexes

Le théorème suivant résume les 3 caractérisations principales de la convexité en terme de dié-
rentiabilité, par la position relative des plans tangents et du graphe, par la monotonie de la dérivée
première ou par la positivité de la dérivée seconde (le résultat n'est pas optimal, il sut en fait d'une
dérivabilité directionnelle appelée dérivée au sens de Gâteaux) :
Théorème 3.12. Soit E un e.v.n. et U un ouvert convexe, f : U → IR une fonction diérentiable

en tout point de U .
1. f est convexe ssi pour tout u, v ∈ U :
f (u) − f (v) ≥ df (v).[u − v]
2. f est convexe ssi pour tout u, v ∈ U :
[df (u) − df (v)].[u − v] ≥ 0
3. Si f est en plus C , f est convexe ssi d f (x) est positive pour tout x ∈ U au sens où
2 2
d f (x)(h, h) ≥ 0 pour tout x ∈ U, h ∈ E. De plus, si E = IR avec la norme euclidienne, ou

2 n
plus généralement si E est préhilbertien (cf. chapitre 5), si d f (x) est dénie positive, pour
2
tout x ∈ U (c'est-à-dire pour tout h ̸= 0, d f (x)(h, h) > 0) alors f est strictement convexe.
2
44
Remarque . 3.3 (Rappel d'algèbre linéaire) Si E = IRn , alors d2 f (x) est positive si et seulement si
∂2f
la matrice hessienne Hf (x) est positive (rappel (Hf (x))ij = (
∂xi ∂xj
(x))). Comme elle est toujours
symétrique et donc diagonalisable en base orthonormale,
cela
équivaut à ce que ces valeurs propres
r s
soient toutes positives. Dans le cas n = 2 H(f )(x) = (c'est à dire on prend les notations de
s t
∂2f ∂2f ∂2f
Monge r= ∂x2
(x), s = ∂x∂y
(x), t = ∂y 2
(x)) alors H(f )(x) est positive si et seulement si rt − s2 ≥ 0
et r ≥ 0. 1
Remarque . 3.4
2
Un cas particulier du (3) est le cas où il existe c > 0 telle que d f (x)(h, h) ≥ c||h||
n
2
pour tout x ∈ U, h ∈ E = IR . Le cas de stricte convexité se déduit donc en décomposant f =

g + 2c ||x||2 . L'inégalité donne que d2 g = d2 f − c est positive donc g convexe et on verra au dernier
c 2
chapitre que l'identité du parallélogramme implique que ||x|| est strictement convexe, donc par
2
somme f est strictement convexe (de façon très uniforme). C'est une situation intéressante pour
les problèmes de minimisation qui permet d'obtenir la convergence de suites minimisantes et des
stratégies algorithmiques de minimisation (cf. cours de recherche opérationnelle au S6).
Démonstration. f convexe, l'inégalité vient du corollaire 3.5 en comparant l'inmum à la valeur

(1) Si
en t=1 pour h=u−v :
f (v + th) − f (v)
df (v).[u − v] = inf ≤ f (u + h) − f (u) = f (u) − f (v).
t>0 t
Réciproquement on applique l'inégalité en z = tx + (1 − t)y ∈ U par convexité de U pour x, y ∈ U
d'où :
(A) f (x) − f (z) ≥ df (z)[x − z], (B) f (y) − f (z) ≥ df (z)[y − z],
et t(A) + (1 − t)(B) donne
tf (x) + (1 − t)f (y) − f (z) ≥ df (z)[t(x − z) + (1 − t)(y − z)] = df (z)(0) = 0
ce qui donne l'inégalité de convexité.

(2) Si f convexe, on utilise de même les inégalités du corollaire 3.5 :
df (u)(v − u) ≤ f (v) − f (u), df (v)(u − v) ≤ f (u) − f (v)
En sommant, on obtient l'inégalité (df (u) − df (v))(v − u) ≤ 0. Réciproquement, on utilise ϕ(t) =

f (tx + (1 − t)y) qui par composition est dérivable de dérivée ϕ′ (t) = df (tx + (1 − t)y)(x − y). Or si
t<s
ϕ′ (s) − ϕ′ (t) = [df (y + s(x − y)) − df (y + t(x − y))](x − y)

1
= [df (y + s(x − y)) − df (y + t(x − y))](y + s(x − y) − (y + t(x − y))) ≥ 0
s−t
1. En eet D2 f (x)((h1 , h2 ), (h1 , h2 )) = rh21 + 2sh1 h2 + th22 = (h21 )P (h2 /h1 ) si h1 ̸= 0, avec P (λ) = r + 2sλ + tλ2
le polynôme de second degré de discriminant ∆ = 4s2 − 4rt. Si ∆ < 0 pas de racine et selon le signe de r, P est soit
toujours positif (cas D2 f (a) dénie positive) soit toujours négative (D2 f (a) dénie négative). Si ∆ = 0, il y a une
racine double et on a la même conclusion sur la positivité. Si h1 = 0, alors D2 f (x)((h1 , h2 ), (h1 , h2 ))) = 2sh1 h2 n'est
positive que si s = 0 car sinon en (h1 , h2 ) = (s, −1), on a la valeur strictement négative −2s2 et c'est aussi le seule
cas ou le déterminant rt − s2 est positif pour r = 0). Si ∆ > 0 on a 2 racines réelles et P prend à la fois des valeurs
positives et négatives.
45
Donc ϕ′ est croissante et par un résultat à 1 variable (proposition 3.12) ϕ est convexe.
(3)Si f est C 2 , on dérive en t la relation du (2) avec v = x, u = x + th une fois divisée par t2
2
et on obtient d f (x)(h, h) ≥ 0. Réciproquement, en dérivant en t, la fonction g dénie par g(t) =
df (v + t(u − v))(u − v) (qui est C 1 car df est C 1 ) et en appliquant le théorème fondamental du calcul :
Z 1
[df (u) − df (v)][u − v] = g(1) − g(0) = dtdf (v + t(u − v))(u − v, u − v) ≥ 0
0
et on retrouve le critère du (2).

Pour la stricte convexité, commençons par le cas E = IR, donc U = I un intervalle ouvert. Soit
′ ′ ′ ′
[a, b] ⊂ I strictement convexe sur [a, b]. On xe [a, b] ⊂]a , b [⊂ [a , b ] ⊂ I
il sut de voir f
′′ ′′ 2 ′′
On suppose dans ce cas f (x) > 0 pour tout x ∈ I et f continue (vue f de classe C ). Donc f
′ ′ ′′ ′′ ′ ′ ′ ′
atteint son minimum sur [a , b ] en x0 de sorte que f (x) ≥ c = f (x0 ) > 0 pour tout x ∈]a , b [⊂ [a , b ].
x2 ′′
Donc comme à la remarque 3.4 implique f = g +c avec g ≥ 0 donc g convexe et donc f strictement
2
′ ′
convexe sur ]a , b [.
n
On pose ga,b (t) = ta + (1 − t)b. Soit maintenant le cas général E = IR . Par dénition, f
est strictement convexe si et seulement si pour tout segment [a, b] ⊂ U, a ̸= b, ha,b = f ◦ ga,b est
′′
strictement convexe sur [0, 1] (ou sur ]0, 1[ en élargissant les intervalles comme avant). Or ha,b (t) =
2
df (ga,b (t))(a−b, a−b) > 0 pour tout t ∈]0, 1[. On déduit donc du premier cas que ha,b est strictement
′ ′ ′ ′
convexe sur ]0, 1[ et donc aussi f . Comme U ouvert, on peut trouver a , b ∈ U avec [a, b] ⊂ [a , b ] −
′ ′ ′ ′
{a , b }, [a , b ] ⊂ U .
′ ′ ′ ′ ′ ′
Pour montrer Comme ga′ ,b′ est continue bijective de [0, 1] → [a , b ] si a ̸= b , [a , b ] est compact
comme image direct du compact [0, 1] par une application continue.
t 7→ h′′a,b (at + (1 − t)(b − a)) = d2 f (at + (1 − t)(b − a))(b − a, b − a) est continue sur [a′ , b′ ] donc
′ ′ ′′ 2
atteint son minimum en x0 ∈ [a , b ] qui est donc ha,b (x) = d f (x0 )(b − a, b − a) ≥ cx0 (b − a, b − a).
′ ′
En appliquant à l'intervalle ouvert ]a , b [ le premier cas, on déduit que ha′ ,b′ est strictement convexe
′ ′
sur ]a , b [, donc aussi par restriction ha,b . Comme a ̸= b ∈ U arbitraires, f est aussi strictement
convexe.
Exercice . 3.6 Montrer quef (x) = x4 est strictement convexe sur IR mais que sa dérivée seconde n'est
pas bornée inférieurement par c > 0.
3.3 Convexité, Critère d'extremum global

On retrouve d'abord un critère d'optimisation du premier ordre
Proposition 3.13. Si f est de classe C sur un ouvert convexe U et f est convexe, alors tout point
1
a ∈ U est un minimum global de f si et seulement si c'est un point critique de f (c'est à dire un

point a tel que df (a) = 0).
Démonstration. f
On sait déjà par le cours de L2 que si a df (a) = 0
a un minimum local en alors .
En eet, rappelons la preuve, pour tout h ∈ E, il existe ϵ > 0 : B(a, ϵ||h||) ⊂ U (car U ouvert) et
f (a ± th) ≥ f (a) pour tout t ∈] − ϵ, ϵ[. Donc, en divisant par t > 0 on obtient :
f (a + th) − f (a)
→t→0+ df (a)(h) ≥ 0
t
f (a − th) − f (a)
→t→0+ df (a)(h) ≤ 0
−t
46
donc df (a)(h) = 0 pour tout h df (a) = 0.
ce qui veut dire
La nouveauté est la réciproque, on suppose f convexe. Il sut de noter par le théorème 3.12 que
pour c ∈ C , f (c) − f (a) ≥ df (a)(c − a) = 0 donc f (a) = inf c∈C f (c) et a atteint l'inmum de f sur
C.
n
On a un critère d'optimisation plus général sur un convexe C ⊂ IR . On rappelle que ∇f (a) =
∂f ∂f
( ∂x1 (a), ..., ∂x (a)).
Soit C un convexe de IR avec C ⊂ U un ouvert et f : U → IR une fonction de
n
Théorème 3.14. n
classe C , convexe sur C . Alors a est un minimum global de f sur C si et seulement si −∇f (a) ∈
1
N (a) c'est à dire si et seulement si

C
∀c ∈ C, ⟨∇f (a), c − a⟩ ≥ 0.
Démonstration. On rappelle la dénition NC (a) = {f ∈ E : ∀c ∈ S, ⟨f, c − a⟩ ≤ 0} ce qui donne la

dernière reformulation. Si a est un minimum global f (a) ≤ f (tc + (1 − t)a) pour c ∈ C, t ∈]0, 1[ vu
que par convexité tc + (1 − t)a ∈ C . En prenant la limite, on obtient
f (t(c − a) + a) − f (a)
⟨∇f (a), c − a⟩ = lim+ ≥0
t→0 t
Réciproquement, si l'inégalité est vériée donc on peut utiliser le théorème 3.12 (dont la preuve
du 1 s'applique même si C n'est pas ouvert) et on obtient :
0 ≤ ⟨∇f (a), c − a⟩ = df (a)(c − a) ≤ f (c) − f (a).
donc f (c) ≥ f (a) pour tout c∈C et donc a est un minimum de f sur C.
Exemple . 3.4 On prend g(c) = ||f − c||22 le carré de la distance euclidienne à f ∈ E. Alors ∇g(a) =
−2(f − a) et donc on obtient que a ∈ C minimise la distance de x à C si et seulement si :
∀c ∈ C, ⟨x − a, c − a⟩ ≤ 0.
Ce sera le critère du théorème de projection sur un convexe fermé C où l'on verra l'existence d'un tel
n
point a au dernier chapitre. Dans IR on peut aussi voir l'existence par compacité de C ∩ B pour une
boule fermée B assez grande pour qu'une inégalité grossière permette d'assurer que tout minimum
doive s'y trouver. On obtient ainsi le résultat suivant.
Théorème 3.15. (théorème de projection sur un convexe fermé de IR ) n
Soit C ⊂ IR = E un convexe fermé non-vide et ||.|| la norme euclidienne. Pour tout f ∈ IR ,

n n
il existe un unique u = P (f ) tel que

2
C
||f − u||2 = inf ||f − v||2 .

v∈C
De plus, c'est l'unique vecteur u ∈ C tel que :

∀v ∈ C, ⟨f − u, v − u⟩ ≤ 0.
De plus, pour tout c ∈ C , c + N (c) = P C

−1
C ({c}) et forment une partition de IR . n
La preuve suivante par compacité ne fonctionnera pas en dimension innie, mais le résultat sera
encore vrai dans un espace de Hilbert (cf. chapitre 5).
47
Démonstration. Comme C non vide r = inf v∈C ||f − v||2 < ∞. Soit D = C ∩ B(f, r + 1). Comme la
boule fermé est un convexe fermé, D
est un convexe fermé comme intersection de convexes fermés, et
n
il est aussi borné par dénition, donc c'est un compact de IR . De plus, D ⊂ C , donc inf v∈C ||f −v||2 ≤
inf v∈D ||f − v||2 par dénition de l'inmum. Mais soit 1 > ϵ > 0 et v ∈ C tel que ||f − v||2 ≤ r + ϵ
alors par dénition v∈D et donc inf d∈D ||f − d||2 ≤ ||f − v||2 ≤ r + ϵ. Donc en passant à la limite
ϵ → 0, on a obtenu :
inf ||f − v||2 ≤ r = inf ||f − v||2 ≤ inf ||f − v||2 .
v∈D v∈C v∈D
Or v 7→ ||f − v||2 est continue sur le compact D, donc atteint son inmum en u ∈ D ⊂ C . Par
2 2
croissance du carré, c'est aussi le point où ||f −v||2 atteint son inmum. La hessienne de v 7→ ||f −v||2
est l'identité, donc cette application est strictement convexe, elle a donc un unique minimum PC (f ).
La caractérisation du minimum a été vue à l'exemple précédent. Enn cette caractérisation donne
(en retraduisant avec la dénition de NC (c)
PC−1 ({c}) = {f ∈ E : ∀v ∈ C, ⟨f − c, v − c⟩ ≤ 0} = {f ∈ E : f − c ∈ NC (c)} = c + NC (c).
Le fait que PC : E → C est une application surjective (vu que PC (c) = c pour c ∈ C) implique le
résultat sur la partition.
4 Premières Inégalités de convexité

Citons un exemple important et simple.
Exercice . 3.7 f : [0, +∞[→ [0, +∞[

Soit une fonction concave. Montrer que pour tout x, y ≥ 0 on a
f (x + y) ≤ f (x) + f (y).
Démonstration. Fixons y≥0 et considérons la fonction g : [0, +∞[→ IR dénie par g(x) = f (x) +
f (y) − f (x + y).
Alors, pour tout a < b ∈ [0, +∞[, on a
g(b) − g(a) f (b) − f (a) f (b + y) − f (a + y)

= − .
b−a b−a b−a
f (b + y) − f (a + y) f (b + y) − f (a + y)
Puisque = est le taux d'accroissement de f entre (b + y) et
b−a (b + y) − (a + y)
g(b) − g(a)
(a + y), l'inégalité des pentes nous donne donc que ≥ 0, autrement dit g est croissante.
b−a
Par conséquent, on a pour tout x que g(x) ≥ g(0) = f (0), et donc f (x)+f (y)−f (x+y) ≥ f (0) ≥ 0,
ce qu'on voulait démontrer.
On verra au chapitre intégration section 5.2 l'inégalité la plus importante, l'inégalité de Jensen,
p
qu'on appliquera ensuite au chapitre Espace L .
Voici en exercice un cas (très) particulier de l'inégalité de Jensen (cf. Corollaire 5.6 pour une
preuve).
Exercice . 3.8 Soit I un intervalle de IR, α1 , . . . , αn des réels positifs tels que
Pn
i=1 αi = 1, et φ une
fonction convexe sur I. Alors, pour tout x1 , . . . , xn ∈ I on a
n
! n
X X
φ αi xi ≤ αi φ(xi ) .
i=1 i=1
48
Chapitre 4
Intégration de Lesbesgue : Construction de
l'intégrale et grands théorèmes
Le but de ce chapitrDénition et premières propriétése est de donner le cadre pour votre cours
de probabilité du second semestre, en pensant l'espérance comme une intégrale, tout en généralisant
l'intégrale de Riemann et la somme de série vues en L1 ou en L2. Ce seront aussi les 2 exemples
importants uniés dans ce chapitre (qui donnent les exemples des variables aléatoires continues et
discrètes).
On va se concentrer dans ce chapitre sur la construction de l'intégrale et les grands théorèmes
qu'il faut apprendre à utiliser. On verra le minimum des dénitions requises pour formuler cette
construction. Pour cela, on va s'appuyer sur les similarités avec vos cours de probabilités et avec
le chapitre 1. Ce sont des constructions importantes dont la démarche sera reprise par exemple au
semestre prochain pour la construction de l'espérance conditionnelle. On reporte au deux chapitres
suivants les résultats plus techniques dont il est moins important de retenir une idée des preuves.
Dans ce chapitre, le corps est IK = IR ou IK = C.
l Pour l'intégration, on a aussi besoin de la
droite réelle étendue : IR = IR ∪ {−∞, +∞} avec les mêmes conventions qu'au chapitre précédent :
∞+∞=∞ et λ.∞ = ∞ si λ > 0, 0.∞ = 0.
Rappels
0.1 Droite réelle étendue
Rappel . 4.1 La somme x+y avec x, y ∈ IR, est dénie à l'exception du cas où x = ±∞ et y = −x.
Contrairement au cas des limites, on pose 0. + ∞ = 0, t. + ∞ = +∞ pour t > 0.
Pour un ensemble A non-vide (non-nécessairement borné), on utilise sup A pour le plus petit
majorant M ∈ IR de A et inf A pour le plus grand minorant m ∈ IR de A.
On utilisera aussi inf ∅ = +∞, sup ∅ = −∞.
Exercice . 4.1 Soient A, B parties non vides de R. Montrer que :
1. M = sup A ssi M est un majorant de A et il existe une suite (xn ), avec xn ∈ A telle que
xn → M . Caractérisation analogue de inf A .
2. Tout A (non-vide) admet une borne supérieur sup A ∈] − ∞, ∞] et une borne inférieur inf A ∈
[−∞, ∞[.
3. sup A et inf A sont uniques.
49
4. sup(−tA) = −t inf A, ∀t ∈]0, ∞[. Formules analogues pour sup(tA), inf(tA), inf(−tA).
5. sup(A + B) = sup A + sup B et inf(A + B) = inf A + inf B (avec la somme usuelle d'ensemble
A + B = {a + b : a ∈ A, b ∈ B}.
6. Si A ⊂ B, alors inf B ≤ inf A ≤ sup A ≤ sup B .
7. Si (xn )n≥0 est une suite croissante de réels, alors lim xn = sup{xn ; n ≥ 0} = sup xn . Énoncé
analogue pour une suite décroissante.
8. Si sup A > x ∈ IR, alors il existe un y∈A tel que y > x.
0.2 Limites inférieures et supérieures

Dénition 4.1. Pour une suite xn ∈ IR,
lim sup xn = inf sup xk = lim sup xk

n n≥1 k≥n n→∞ k≥n
(L'égalité vient de la décroissance de la suite des sup, et c'est aussi la plus grande valeur d'adhé-
rence :exo),
lim inf xn = sup inf xk = lim inf xk .
n n≥1 k≥n n→∞ k≥n
(c'est aussi la plus petite valeur d'adhérence exo)
Lemme 4.1. On a les formules suivantes (pour t > 0) :

lim sup −xn = − lim inf xn , lim inf −xn = − lim sup xn
lim sup txn = t lim sup xn , lim inf txn = t lim inf xn
lim sup xn + yn ≤ lim sup xn + lim sup yn
lim inf xn + yn ≥ lim inf xn + lim inf yn
Enn, lim sup x n = lim inf xn = ℓ ∈ IR si et seulement si x n →ℓ .
Démonstration. Toutes les (in)égalités sont des conséquences des propriétés des sup, inf puis un
passage à la limite :
sup −xn = − inf xn , inf −xn = − sup xn
k≥n k≥n k≥n k≥n
sup txn = t sup xn , inf txn = t inf xn

k≥n k≥n k≥n k≥n
sup xn + yn ≤ sup xn + sup yn

k≥n k≥n k≥n
inf xn + yn ≥ inf xn + inf yn

k≥n k≥n k≥n
Enn, le sens intéressant est celui où lim sup xn = lim inf xn = ℓ ∈ IR et alors Xk = inf k≥n xk ≤
xk ≤ supk≥n xn = Yk et le théorème des gendarmes permet de conclure que la limite commune de
Xk , Yk est aussi la limite ℓ de xk . Réciproquement, si xn → ℓ, alors pour tout ϵ > 0, pour n grand,
ℓ − ϵ ≤ xn ≤ ℓ + ϵ d'où on déduit ℓ − ϵ ≤ lim inf xn ≤ lim sup xn ≤ ℓ + ϵ et ϵ → 0 conclut.
50
1 Tribus, fonctions mesurables et mesures
1.1 Tribus
Vous avez l'habitude de parler d'évènement d'un espace de probabilité et de considérer la famille
T ⊂ P(Ω) des évènements d'un tel espace. Souvent (pour les probabilités discrètes), on peut prendre
T = P(Ω), l'ensemble de toutes les parties de Ω, mais cela ne sera pas possible pour généraliser
l'intégrale de Riemann, on ne pourra pas dénir l'intégrale de n'importe quel ensemble. La dénition
suivante retient donc les propriétés essentielles de la famille des évènements que l'on veut pour dénir
une probabilité sur une telle famille.
Dénition 4.2. Une tribu (ou σ-algèbre) sur Ω est une famille T de partie de Ω, soit T ⊂ P(Ω)
telle que :
1. ∅∈T
2. Si A∈T alors Ac ∈ T .
3. Pour toute suite innie (dénombrable)

[ (An )n≥1 de parties de T , alors leur union est aussi dans
la tribu An ∈ T .
-mesurable mesurable
n≥1
A∈T T
espace mesurable
Un ensembe est appelée partie ou simplement .
(Ω, T ) Ω T Ω.
ensembles mesurables (pour la tribu T ou T -mesurables).
Un est une paire formée d'un ensemble et d'une tribu sur Les
enembles A∈T sont appelés
Le résultat suivant est assez évident
Lemme 4.2. Pour toute suite nie A , · · · , A de T , alors A ∪ · · · ∪ A ∈ T .

Pour toute suite innie (dénombrable, resp. nie) (A ) (resp. A , · · · , A ) de parties de T ,
1 n 1 n
n n≥1 1 n
alors leur intersection \ A ∈ T (resp. \ A ∈ T ).

n
n i
n≥1 i=1
Démonstration. [ Pour le premier, il sut de prolonger la suite en Ak = ∅ ∈ T pour k ≥ n + 1 et alors

A1 ∪ · · · ∪ An = An ∈ T
n≥1
Pour l'intersection, il sut de combiner union et complémentaire, par exemple dans le cas dé-
\ [ c
nombrable : An = Acn ∈ T .
n≥1 n≥1
Remarque . 4.2 On verra au chapitre suivant la notion plus élémentaire d'algèbre de parties (ou clan)
où l'on demande seulement la stabilité par union nie, mais elle ne sura pas pour la construction
de l'intégrale. Il faut comparer la notion de tribu à celle de topologie de la remarque 2.3, qui était
l'axiomatisation des parties ouvertes d'un espace métrique. Comme une topologie, une tribu est stable
par intersection nie, mais même plus elle est stable par intersection dénombrable. Mais par contre,
elle n'est pas stable par union quelconque, mais seulement par union dénombrable. Donc aucune
des notions n'est plus générale que l'autre. Enn, la nouveauté est la stabilité par complémentaire,
ou autrement dit par toutes les opérations logiques de bases sur les ensembles (complémentaire,
intersection et union binaires), et c'est la clef pour son application en probabilité (on veut aussi
que les évènements soient stables par toutes les opérations logiques). On va cependant traiter dans
beaucoup d'aspect la notion de tribu comme la famille des ouverts d'un espace métrique (ou plus
généralement topologique).
51
1.2 Mesure et Probabilité sur une tribu
L'intégation va dépendre d'un objet de base qui permet la mesure du volume" (ou en physique la
mesure de la masse" ou d'autres grandeurs extensives) et qui va généraliser la notion de probabilité.
Dénition 4.3 (Dénition d'une mesure). (Ω, T ) un espace mesurable

mesure (positive)
Soit .
On appelle est une application µ : T → [0, +∞] ayant les propriétés suivantes :
1. µ(∅) = 0
2. (σ -additivité) Pour toute suite au plus dénombrable (Ai )i∈I 1 d'éléments de T deux à deux
disjoints,
[ X
µ( Ai ) = µ(Ai ).
i∈I i∈I
mesure de probabilité P P vériant en plus P (Ω) = 1. Un espace mesuré

(resp. de probabilité)
Une est une mesure positive
est un triplet (Ω, T , µ) (Ω, T , P )) formée d'une mesure positive µ
(resp. (resp.
une mesure de probabilité P) sur un espace mesurable (Ω, T ).
Une mesure a des propriétés très similaires à celle d'une probabilité dont vous avez l'habitude
(exo).
Proposition 4.3. i) Si A ⊂ B alors µ(A) ≤ µ(B) S(µ est croissante).

ii) Pour toute suite au plus dénombrable (A ) , µ( A ) ≤ P µ(A ) (µ est sous-additive).
iii) Si (A ) est une suite croissante,
i i∈I i∈I i i∈I i
n n≥1
[
µ( An ) = lim µ(An ) = sup µ(An ).
n→∞ n≥1
n≥1
iv) Si (A ) est une suite décroissante avec µ(A ) < ∞,

n n≥1 1
\
µ( An ) = lim µ(An ) = inf µ(An ).
n→∞ n≥1
n≥1
v) Si µ(Ω) est nie : µ(A ) = µ(Ω) − µ(A).

c
1.3 Ensembles µ-négligeables

Dénition 4.4. (Ω, T , µ) un espace mesuré,
Soit un ensemble A⊂Ω est µ -négligeable si il existe
B∈T contenant A ⊂ B et avec µ(B) = 0.
Attention, A n'est par forcément mesurable donc on ne peut PAS déduire µ(A) = 0. Mais la seule
extension possible, si A devenait mesurable, serait la valeur 0.
Lemme 4.4. Une union au plus dénombrable d'ensembles µ-négligeables est µ-négligeable.
Démonstration. (A ) Si µn n≥0 est B ∈ T
-négligeable, alors il existe une suite µ(B ) = 0 n avec n et
An ⊂ Bn , donc
[ [ [ X
An ⊂ Bn ∈ T , µ Bn ≤ µ(Bn ) = 0.
n≥0 n≥0 n≥0 n≥0
1. c'est à dire soit I = [[0, n]] et dans ce cas i∈I µ(Ai ) = ni=0 µ(Ai ), soit soit I = IN et dans ce cas i∈I µ(Ai ) =
P P P
i=0 µ(Ai ) est la somme de la série, nie ou +∞

P∞
52
Exercice . 4.2 Montrer que le seul ensemble ν -négligeable pour la mesure de comptage ν est l'ensemble
vide.
Dénition 4.5. Une propriété P (ω)ω ∈ Ω est dite vraie

des points presque partout (par rapport à
µ, ou µ-presque partout, ou µ-.p.p) si {ω ∈ Ω : ¬P (ω)} est µ-négligeable. Autrement dit, si il existe
B ∈ T avec µ(B) = 0 telle que P est vraie sur B c .
Exercice . 4.3 Montrer que l'indicatrice de Q

l 1Q
l
est nulle λ-p.p.
Un ensemble peut donc être dense et λ-négligeable.
1.4 Exemples de tribus

Exemple . T = P(Ω) tribu discrète T = {∅, Ω}
tribu grossière
4.1 est une tribu (appelée ) et est aussi une tribu
(appelée ).
Tribus engendrés par une famille d'ensembles

En pratique, on n'a pas besoin de connaître en détail, tous les éléments contenus dans une tribu,
il sut de savoir qu'on a assez d'élements voulus (les générateurs de la tribu). Ceci est permis par le
lemme suivant.
Lemme 4.5. Si (T ) est une famille de tribus, alors T T est une tribu. On peut donc parler
de la plus petite tribu contenant une famille A ⊂ P(Ω), qui est l'intersection de toutes les tribus
i i∈I i∈I i
contenant A, elle est notée σ(A) et appelée la A.

tribu engendrée par
Démonstration.
T ∅∈T
C'est une conséquence directe de la forme de la dénition. i i pour tout , donc
∅∈ i∈I Ti .
c
T
De plus, siA ∈ i∈IT Ti , alors A ∈ Ti pour tout i, donc comme Ti est une tribu, A ∈ Ti pour
c
chaque i et donc A ∈ i∈I Ti . T
Enn, si pour chaque n ≥ 1, An ∈
S STi , alors A
i∈I Tn ∈ Ti pour tout i, donc comme Ti est une
tribu, n≥0 An ∈ Ti pour chaque i et donc n≥1 An ∈ i∈I Ti .
Exemple . 4.2 (cf. TD) Si A ⊂ Ω, la tribu engendrée par A est σ({A}) = {A, Ac , ∅, Ω}.
Exemple . 4.3 (cf. TD) Si A1 , · · · , An ⊂ Ω forment une partition (c'est à dire sont 2 à 2 disjoints et
d'union Ω), la tribu engendrée σ({A1 , · · · , An }) = {∪i∈I Ai : I ⊂ [[1, n]]}.
Dénition 4.6. Pour (X, d) un espace métrique dont T tribu

borélienne
est la topologie des ouverts, on appelle
sur X, notée B(X) = σ(T ) la tribu engendrée par les ouverts de X.
Le résultat suivant est montré en annexe C en section 2.3.
Lemme 4.6. Sur IR , la tribu borélienne a le système de générateurs :

n
B(IR ) = σ ]a , b [, a < b ∈ IR
Y n
n
i i i i
i=1
A partir de là, on obtiendra en TD les autres générateurs usuels.
53
Lemme 4.7. (cf TD.) Sur IR , la tribu borélienne a les diérents systèmes de générateurs :
n
B(IR ) = σ ] − ∞, b ], b ∈ IR
Y n
n
i i
i=1
IR
Yn
=σ [ai , +∞[, ai ∈
i=1
IR
Yn
=σ [ai , bi ], ai < bi ∈
i=1
IR

n
= σ F : F fermé de
Tribu engendrée par une fonction

Lemme 4.8. Soit f : Ω → (E, B) une fonction, σ(f ) := f −1
(B) = {f −1 (B), B ∈ B} ⊂ T est une
tribu sur Ω. On l'appelle tribu engendrée par f.
Démonstration. C'est essentiellement une application des rappels sur l'image réciproque de fonctions
(1.1). D'abord f −1 (∅) = ∅ ∈ σ(f ), f −1 (E) = Ω ∈ σ(f ). Pour A∈B (resp, An ∈ B, n ≥ 1) :
[f −1 (A)]c = f −1 (Ac ) ∈ σ(f ) car Ac ∈ B,

[ [ [
f −1 (An ) = f −1 An ∈ σ(f ) car An ∈ B
n≥1 n≥1 n≥1
1.5 Exemples de mesures

Exemple 4.4 (Mesure de comptage) . Sur tout ensemble Ω, on dénit sur P(Ω), la mesure suivante
(dite de comptage)

Card(A) si A ni
ν(A) =
+∞ sinon
Exemple 4.5 (Mesure discrète sur Ω ni) . Sur tout ensemble dénombrable Ω = {ωn , n ∈ [[1, n]]}, pour
(µi ) ∈ [0, +∞[n on dénit sur P(Ω) : X
µ(A) = µi .
ωi ∈A
P(Ω).
famille sommable
C'est une mesure sur Une fois connue l'intégration pour la mesure de comptage (ou de façon
équivalente si on connaît la notion de , on pourra généraliser cet exemple au cas Ω
dénombrable)
Enn, l'exemple fondamental est le théorème donnant l'existence de la mesure de Lebesgue (ad-
mis)
Théorème 4.9 . (admis) Il existe une unique mesure λ sur

IR , B(IR )) invariante par translation telle que
(dénissant l'intégrale de Lebesgue)
d d 2
(

λ [0, 1]n = 1.
2. au sens ou pour tout a ∈ IRd , B ∈ B(IRd ), si on note a + B = {a + b, b ∈ B}, alors λ(a + B) = Λ(B)
54
Cette mesure est appelée mesure de Lebesgue sur IR et notée λ ≡ λ et elle vérie pour a < b :
d
d i i
n
Y n
Y Yn
λ [ai , bi ] = λ ]ai , bi [ = (bi − ai ).
i=1 i=1 i=1
Proposition 4.10. (dénissant la mesure image) Soit f : Ω → (E, B)une fonction et (Ω, σ(f ), µ)
un espace mesuré alors la formule µ (B) = µ(f (B)) for B ∈ B est une mesure sur T , appelée
f −1
mesure image de µ f. par
Démonstration. µ
Pour voir que
f
B µ (∅) = µ(∅) = 0
est une mesure sur , il faut noter
f
. Puis pour la
σ -additivité, pour Ai ∈ B, i ∈ I deux à deux disjoints avec I au plus dénombrable, on a :
[ [ [ X X
−1 −1
µ f
Ai = µ f Ai =µ f (Ai ) = µ(f −1 (Ai )) = µf (Ai ),
i∈I i∈I i∈I i∈I i∈I
vu que les f −1 (Ai ) ∈ σ(f ) sont aussi deux à deux disjoints par (1.1), on a pu utilisé à l'avant-dernière
égalité la σ -additivité de µ.
1.6 Fonctions mesurables

Il nous reste à spécier les fonctions qu'on va pouvoir intégrer. Il faut lire la dénition suivante
comme l'analogue de la dénition topologique de la continuité (proposition 2.22)
Dénition 4.7.
−1
Une fonction f : (Ω, T ) → (E, B) entre espaces mesurables est
−1
mesurable
si
f (B) ⊂ T pour tout B ∈ B , f (B) ∈ T . Si (Ω, T ) = (X, B(X), (E, B) = (Y, B(Y )),
fonction borélienne
c'est à dire si
on appelle une fonction mesurable f : (X, B(X)) → (Y, B(Y )).
On déduit immédiatement de la dénition comme le corollaire 4.11 :
Lemme 4.11. (Stabilité par composition de la mesurabilité) Si f : (D, A) → (E, B) et g : (E, B) →

(F, C) sont mesurables, alors, g ◦ f : D → F est mesurable.
Démonstration. Pour tout ensemble mesurable
−1 −1
,
−1
U ∈ C g (U ) ∈ B est mesurable de Ypar mesura-
−1 −1
bilité de g , puis f (g (U )) ∈ T est mesurable de X par mesurabilité de f , mais f (g (U )) =
−1
(g ◦ f ) (U ) ∈ A. Comme c'est vrai pour tout ensemble mesurable U , on déduit de la dénition
précédente g◦f est mesurable.
Comme en probabilité, l'intérêt principal de la notion de mesurabilité est de permettre de dénir

la notion de mesure image (analogue de la loi d'une variable aléatoire).
Proposition 4.12. Soit f : Ω → (E, B) une fonction, la tribu engendrée par f du lemme 4.8
σ(f ) := f −1 (B) = {f −1 (B), B ∈ B} est la plus petite tribu rendant f mesurable. Autrement dit : Si
T ⊂ P(Ω) est une tribu, f : (Ω, T ) → (E, B) est mesurable si et seulement si σ(f ) ⊂ T .
Démonstration. σ(f ) est une tribu. f : (Ω, σ(f )) → (E, B) est mesurable
On a vu au lemme 4.8 que
par dénition, car pour tout B ∈ B,f −1 (B) ∈ σ(f ) par dénition de σ(f ), et cela veut dire
on a
f : (Ω, σ(f )) → (E, B) est mesurable par dénition de la mesurabilité. L'équivalence f : (Ω, T ) →
(E, B) est mesurable si et seulement si σ(f ) ⊂ T vient aussi directement des deux mêmes dénitions.
L'inclusion σ(f ) ⊂ T dit justement que σ(f ) est plus petite (pour l'inclusion) que toute tribu rendant
f mesurable.
55
Exemple .
4.6 Si A ∈ T , la fonction indicatrice 1A : (Ω, T ) → (IR, B(IR)) est mesurable, car σ(1A ) =
σ({A}) = {A, Ac , ∅, Ω} par l'exemple 4.2 et donc σ(1A ) ⊂ T par la dénition d'une tribu.
En pratique, on a besoin d'une description en terme de parties génératrices :
Lemme 4.13. Une fonction f : (Ω, T ) → (E, σ(A)), vers un espace mesurable engendré par une
famille A, est mesurable si et seulement si f (A) ⊂ T c'est à dire si pour tout A ∈ A, f (A) ∈ T .
−1 −1
Démonstration. f Si A ⊂ σ(A)
mesurable, vu que f (A) ∈ T , le fait que
−1
est une conséquence
directe de la dénition. Le contenu du lemme est donc la réciproque.
On introduit une fammille B (qui va se révéler être la plus grande tribu de E rendant f mesurable,
la preuve est donc très similaire à celle sur σ(f )) :
B = {B ∈ P(E) : f −1 (B) ∈ T }.
Par hypothèse A ⊂ B. Vérions que B est une tribu (par la dénition) :

−1
∅ ∈ B car f (∅) = ∅ ∈ T
−1
Si B ∈ B , alors f (B c ) = f −1 (B) c
∈ T car TSest une tribu donc B c ∈ B
−1
( n≥1 An ) = n≥1 f −1 (An ) ∈ T car T est une tribu donc
S
Si An ∈ B , n ≥ 1, alors f
S
n≥1 An ∈ B
En conséquence, B est une tribu qui contient A, donc σ(A) ⊂ B ce qui dit exactement : ∀B ∈ σ(A) :
f −1 (B) ∈ T soit la dénition de f mesurable.
Corollaire 4.14. Une fonction f : (Ω, T ) → (Y, B(Y )) vers la tribu borélienne d'un espace métrique
est mesurable, si et seulement si pour tout ouvert U (resp. tout fermé F ) on a f (U ) ∈ T (resp. −1
f (F ) ∈ T ). En particulier, si (Ω, T ) = (X, B(X)) pour un espace métrique X , alors, toute fonction
−1
continue f est borélienne.

Démonstration.

Le premier résultat est une conséquence directe du lemme vu que B(Y ) = σ {U ⊂

Y : U ouvert} = σ {F ⊂ Y : F fermé} . Par la proposition 2.22, f −1 (U ) est ouvert (resp.
f −1 (F ) est fermé) donc dans B(X) pour tout ouvert U de Y, on déduit que la continuité implique
la mesurabilité.
En composant, avec les produits et sommes qui sont des applications continues, on obtient les
mêmes stabilités algébriques que pour les fonctions continues :
Corollaire 4.15. Les fonctions mesurables (Ω, T ) → IR sont stables par combinaisons linéaires,
produits, fractions rationnelles à dénominateur non nulle, passage à l'exponentielle (etc.)
On tire de même immédiatement des lemmes 4.6 et 4.7 :
Corollaire 4.16. Une fonction f = (f , · · · , f ) : (Ω, T ) → (IR , B(IR )) est mesurable si et seule-
n n
ment si l'une des assertions suivantes est vériée :

1 n
1. Pour tout b , · · · , b ∈ IR, f Y] − ∞, b ] ∈ T

n
−1
1 n i
i=1
2. Pour tout a , · · · , a ∈ IR, f

Y n
−1
1 n [ai , +∞[ ∈ T
i=1
3. Pour tout a IR, f

n
Y
−1
1 < b1 , · · · , an < bn ∈ [ai , bi ] ∈ T
i=1
56
4. Pour tout a < b , · · · , a < b ∈ IR, f
n
Y
−1
1 1 n n ]ai , bi [ ∈ T .
5. Pour tout i = 1, · · · , n, f , · · · , f : (Ω, T ) → (IR, B(IR)) sont toutes mesurables.

i=1
1 n
Corollaire 4.17. Une fonction f : (Ω, T ) → (R, B(R)) (à valeur dans l'espace métrique (IR, dIR ) de
l'exemple 2.5) est mesurable si et seulement si les trois assertions suivantes sont vériées :
1. f ({∞}) ∈ T
−1
2. f ({−∞}) ∈ T
−1
3. Pour tout a < b ∈ IR, f ([a, b]) ∈ T

−1
On renvoie aussi à l'annexe section 3 pour le résultat important suivant
Théorème 4.18. Les constructions suivantes sont mesurables :

1. Un supremum d'une suite f : (Ω, T ) → R de fonctions mesurables
2. La lim sup, lim inf d'une suite f : (Ω, T ) → R de fonctions mesurables
n
3. Une limite simple d'une suite f : (Ω, T ) → R de fonctions mesurables

n
1.7 Unicité des mesures σ-nies

Dénition 4.8. Soit -ni
(Ω, A, µ) un espace mesuré. On dit que (X, A, µ) est σ[ s'il existe une suite
de parties mesurables (An ) telle que µ(An ) < +∞ pour tout n, et Ω = An .
n∈IN
n
Cette hypothèse est par exemple vériée quand µ(Ω) < +∞ (donc en particulier quand µ est une
n
mesure de probabilité), quand Ω= IN muni de la mesure de comptage, ou quand Ω = IR muni de
la mesure de Lebesgue.
On renvoie à l'annexe C en section 1.3 pour une preuve d'un corollaire très classique au lemme
de classe monotone pour les mesures dans le cas des mesures σ -nies.
Corollaire 4.19. (au lemme de classe monotone) Soient µ et ν des mesures sur un espace mesurable
. Soit une famille stable par intersection nie qui engendre T . Si µ et ν coïncident sur E
(Ω, T ) E
(i.e. µ(E) = ν(E), ∀E ∈ E ) et si il existe une suite de parties A ∈ E telle que Ω = ∪ A et
alors et ν sont égales (i.e. µ(B) = ν(B), ∀B ∈ T ).
n n n
µ(An ) = ν(An ) < +∞ µ
2 Les fonctions étagées (mesurables) et leur intégrale

Comme les fonctions en escalier sont la base pour l'intégrale de Riemann, on considère ici la
classe des fonctions étagées (mesurables) qui sont la base de l'intégrale de Lebesgue. Les fonctions
en escaliers sont les combinaisons linéaires des indicatrices d'intervalles
R 1]a,b] . On les prend pour base
de l'intégrale de Riemann car on sait dénit
IR ]a,b]
1 (x)dx = (b − a).
On xe à partir de maintenant un espace mesuré (Ω, T , µ).
Maintenant, qu'on dispose d'une mesure µ, on veut dénir de même pour A∈T :
Z Z
1A dµ ≡ 1A (ω)dµ(ω) = µ(A).
Ω Ω
Plus généralement, on dénit :
57
Dénition 4.9. Pour A, B ∈ T , l'intégrale de 1 sur B par rapport à µ
A est notée et dénie par :
Z Z
f dµ ≡ 1A (ω)dµ(ω) = µ(A ∩ B).
B B
Les combinaisons linéaires de fonctions indicatrices (mesurables) vont donc être de même la base
de l'intégrale de Lebesgue :
Dénition 4.10. Soit (Ω, T ) un espace mesurable, on appelle fonction étagée f : (Ω, T ) → IR d
une
fonction de la forme
n
X
f (ω) = ai 1Ai (ω)
i=1
pour
d
ai ∈ IR et Ai ∈ T . Pour d = 1, la représentation est dite canonique si a1 < · · · < a n , tous non
nuls (∀i, ai ̸= 0) et les A1 , · · · , An sont deux à deux disjoints et non vides.
Exercice . 4.4 Les fonctions étagées sur (Ω, T ) forment un sous espace vectoriel des fonctions Ω → IRd .
Comme on veut que l'intégrale soit linéaire, on est conduit à la dénition suivante :
n
Dénition 4.11. Soit f
X
une fonction étagée positive f (ω) = ai 1Ai (ω) avec Ai ∈ T des ensembles
mesurables deux à deux disjoints (ai > 0), on dénit l'intégrale de f

i=1
sur B∈T par rapport à µ par :
Z Z n
X
f dµ ≡ f (ω)dµ(ω) = ai µ(Ai ∩ B).
B B i=1
On reporte à l'annexe C section 4.2 la preuve facile mais fastidieuse du lemme suivant :
Lemme 4.20. Soit (Ω,RT , µ) un Respace mesuré, et f, h : (Ω, T ) → [0, +∞] étagées positives, B ∈ T :
1. Si f ≥ 0, alors f dµR= 1 f dµR.
2. Si f ≥ 0, c >R 0, alors cfR dµ = c R f dµ.
B Ω B
3. (additivité) f + hdµ = f dµ + R hdµ. R

B B
4. (monotonie) Si 0 ≤ f ≤ h alors 0 ≤ f dµ ≤ hdµ.

B B B
B B
Le résultat crucial qui va permettre l'extension de l'intégrale est le résultat suivant :
Lemme 4.21. Soit (Ω, T ) un espace mesurable. Toute fonction mesurable positive f : (Ω, T ) →
(IR, B(IR)) est limite simple d'une suite croissante de fonctions étagées positives.
Démonstration. On prend
 k k
n −1
4X
2n
si
2n n
≤ f (x) < k+1
2n
,0 ≤ k < 4n
k 
4 −1+1
fn (x) = 2n 1{x:f (x)=+∞} + 1 −1 k k+1 (x) = 0 si
2n
n
= 2 ≤ f (x) < +∞ ≤ f (x).
2n f ([ 2n , 2n [)  n
k=0 2 si f (x) = +∞
1. Comme f mesurable, chacun des f −1 ([ 2kn , k+1

2n
[) ∈ T et f −1 ({+∞}) ∈ T et donc fn est étagée
(comme combinaison linéaire de fonctions indicatrices mesurables).
58
0 ≤ fn ≤ fm pour n ≤ m. Sur f −1 ([0, 2n ]), on découpe chaque intervalle
2. La suite est croissante
m−n k
de dénition de fn en 2 ensembles dans la dénitions de fm . Si fm (x) = m ≤ f (x) <
2
k+1
2m
, 0 ≤ k < 2m+n , on trouve k = κ2m−n + l pour 0 ≤ l < 2m−n , 0 ≤ κ < 4n par division
euclidienne et
κ k κ l κ l+1 l+1
fn (x) = ≤ f m (x) = = + ≤ f (x) < + ≤ f n (x) +
2n 2m 2n 2m 2n 2m 2m
Sur f −1 (]2n , +∞[) on a fn (x) = 0 ≤ fm (x). Vu fn (x) ≤ f (x) ≤ fn (x) + 1
2n
on en déduit
f (x) − 21n ≤ fn (x) ≤ f (x) si f (x) ≤ 2n , on déduit la convergence simple.
3 Intégrale des fonctions mesurables positives

On peut maintenant dénir l'intégrale des fonctions mesurables positives :
Dénition 4.12. f : Ω → [0, +∞]

l'intégrale de f sur B ∈ TZ par rapport à µ
Soit une fonction mesurable positive sur un espace mesuré
(Ω, T , µ), on dénit par :
Z Z n o
f dµ ≡ f (ω)dµ(ω) = sup gdµ : g étagée, 0 ≤ g ≤ f ∈ [0, +∞].
Remarque .
B B B
4.3 Pour la mesure de comptage ν sur I, toute suite a : I → [0, +∞] est mesurable
positive et l'intégrale correspond à la dénition de la somme d'une famille sommable :
Z ( )
X X
f dν = ai = sup aj : J ⊂ I, fini .
I i∈I j∈J
Remarque
R R . 4.4 Si f est étagée positive, pour chaque g≤f étagée positive, on a vu au lemme 4.20,
B
gdµ ≤ B
f dµ donc
Z nZ o
f dµ ≥ sup gdµ : g étagée, 0 ≤ g ≤ f .
B B
Et comme f fait parti des g du sup, on a en fait égalité, et la valeur de la dénition du cas étagé
positif coïncide avec la nouvelle valeure.
3.1 Premières propriétés

On reporte à l'annexe C section 4.3 la preuve facile mais fastidieuse du lemme suivant :
Lemme 4.22. Soit (Ω, T , µ) un espace mesuré, et f, h : (Ω, T ) → [0, +∞] mesurable positive,
A, B ∈ T :
1. (monotonie) Si R0 ≤ f ≤ hR alors 0 ≤ R f dµ ≤ R hdµ.
2. Si f ≥ 0, alors f dµR= 1 f dµR. En particulier, pour A ⊂ B, 0 ≤ R f dµ ≤ R f dµ.
B B
3. Si f ≥ 0, c ≥ 0, alors cf dµR = c f dµ.

B Ω B A B
4. Si f = 0 ou µ(B)R = 0, alors R f dµ = 0R.

B B
5. (sur-additivité) f + hdµ ≥ f dµ + hdµ.

B
B B B
La dernière propriété n'est pas optimale, nous verrons l'additivité en utilisant le théorème de
convergence monotone. Nous la mentionnons ici pour signaler que l'additivité n'est pas évidente à
partir de la dénition.
59
3.2 Théorème de convergence monotone de Beppo Levi
Théorème 4.23. (Théorème de convergence monotone ou TCM) Soit Z : (Ω, T ) → [0, +∞], une
suite croissante de fonctions mesurables positives qui tend simplement vers Z . Alors Z est mesurable
n
et pour tout B ∈ T : Z Z Z
lim Zn dµ = Zdµ ≡ lim Zn dµ.
n→∞ B B B n→∞
Démonstration. La mesurabilité de
R
Z vient du théorème 4.18. Posons α = supn B Zn dµ.
Comme Zn ≤ Zm ≤ Z pour n ≤ m, la monotonie de l'intégrale (du lemme 4.22) montre que
Z Z Z
Zn dµ ≤ Zm dµ ≤ Zdµ
B B B
R
Donc, comme la suite
B
Zn dµ est croissante, elle converge vers son sup et :
Z Z
lim Zn dµ = α ≤ Zdµ.
n→∞ B B
1 > ϵ > 0 et une fonction étagée g(ω) = m

P
Pour la réciproque, soit i=1 bi 1Bi (ω) ≤ Z(ω). On
pose An = {ω ∈ Ω : Zn (ω) ≥ Z(ω) − ϵZ(ω)}. Par la monotonie de l'intégrale et la formule pour les
fonctions étagées :
Z Z Z m
X
Zn dµ ≥ Zn 1An dµ ≥ (1 − ϵ) g1An dµ = (1 − ϵ) bi µ(Bi ∩ An ∩ B). (4.1)
B B B i=1
[
Remarquons nalement que An = Ω vu que pour tout ω ∈ Ω, Zn (ω) → Z(Ω) > Z(ω) − ϵZ(ω).
n≥0
Comme Zn est croissante, An est aussi croissante donc par la proposition 4.3,
[
µ(Bi ∩ An ∩ B) → µ( Bi ∩ An ∩ B) = µ(Bi ∩ B).
n
En passant à la limite dans (4.1), on obtient :
m
X Z
α ≥ (1 − ϵ) bi µ(Bi ∩ B) = (1 − ϵ) gdµ
i=1 B
R
soit en passant au sup sur g≤Z puis à la limite ϵ → 0, on obtient l'inégalité voulue α≥ B
Zdµ.
R
On obtient un résultat concret d'approximation pour
B
f dµ.
Corollaire 4.24. RSoit fmesurable positive. Pour toute suite croissante de fonctions étagées telle
que f → f , on a f dµ → f dµ.
n B n
R
B
Corollaire 4.25. (Linéarité de l'intégrale : cas positif) Soient f, g mesurables positives et α, β > 0,
on a : Z Z Z
αf + βgdµ = α f dµ + β gdµ.
B B B
60
Démonstration. Par le lemme 4.21, on a des suites croissantes de fonctions étagées fn → f, gn → g
donc αfn + βgn est une suite croissante de fonctions étagées et αfn + βgn → αf + βg. Par le TCM
ou le corollaire précédent, en passant à la limite dans l'égalité du lemme 4.20 :
Z Z Z Z Z Z
αfn + βgn dµ = α fn dµ + β gn dµ → αf + βgdµ = α f dµ + β gdµ.
B B B B B B
Corollaire 4.26. (Interversion Série-intégraleX: cas positif) Soient f : Ω → [0, +∞] une suite de
fonctions mesurables positives alors la somme f : Ω → [0, +∞] est mesurable et on a pour tout
n
B∈T :
n≥0
Z X XZ
fn dµ = fn dµ.
B n≥0 n≥0 B
Démonstration. La suite des sommes partielles Sn =

Pn
k=0 fk est croissante mesurable (par somme
nie). Le résultat est donc une application du TCM.
3.3 Lemme de Fatou

Théorème 4.27. (Lemme de Fatou) Soit X : (Ω, T ) → [0, +∞], une suite de fonctions mesurables
positives alors lim inf X est mesurable et
n
n→∞ n
Z Z
lim inf Xn dµ ≤ lim inf Xn dµ.
B n→∞ n→∞ B
Démonstration. lim inf n→∞ Xn vient du théorème 4.18.

La mesurabilité de
Par dénition,
R croissante Zm = inf n≥m Xn ≤ Xm . En
lim inf n→∞ Xn = supm ZRm pour la suite
particulier, par monotonie de l'intégrale,
R R Z dµ ≤ B Xn dµ pour n ≥ m, donc en passant à
B m
l'inmum : Z dµ ≤ inf n≥m B Xn dµ.
B m
Par le théorème de convergence monotone, on obtient (en combinant à l'inégalité ci-dessus) :
Z Z Z Z Z
lim inf Xn dµ = lim Zm dµ = sup Zm dµ ≤ sup inf Xn dµ ≡ lim inf Xn dµ.
B n→∞ m→∞ B m B m n≥m B n→∞ B
4 Intégrale des fonctions intégrables

Comme pour les séries et les intégrales impropres en L2, le deuxième cas après le cas positif est
celui qu'on appelle absoluement convergent" pour les séries ou intégrable" pour les intégrales. Ils
ont en commun de considérer la même opération (somme de série ou intégrale) pour la valeur absolue,
et si la grandeur obtenue est nie, on peut alors dénir l'opération sans valeur absolue. On suit la
même stratégie pour l'intégrale de Lebesgue.
On aura besoin de la :
Remarque . f : (Ω, T ) → (IR, B(IR)) une fonction mesurable, sa est f+ = partie positive
partie négative
4.5 Soit
max(f, 0) et sa est f− = max(−f, 0). f+ , f− et la valeur absolue |f | sont mesurables
par composée de f avec des applications continues. Elles vérient f = f+ − f− et |f | = f+ + f− .
61
De même, pour f : (Ω, T ) → (C l , B(C
l )) une fonction mesurable, son module |f |, et ses parties
réelles et imaginaires Re(f ), Im(f ) sont mesurables et
f = Re(f ) + i Im(f ) = Re(f )+ − Re(f )− + i Im(f )+ − i Im(f )− .
Dénition 4.13. (Ω, T , µ) un espace mesuré, une fonction mesurable f : (Ω, T ) → IR) est
intégrale par rapport à sur
Soit
Z µ B ∈ T si son module |f | : (Ω, T ) → [0, +∞] est d'intégrale nie sur B ,

i.e. |f |dµ < +∞. On note L1 (Ω, T , µ) l'ensemble des fonctions intégrables à valeur IR.
B Z Z Z
Si f : (Ω, T ) → (IR, B(IR)) est intégrable sur B, on a donc f+ dµ, f− dµ ≤ |f |dµ < +∞
et on peut dénir l'intégrale de f par rapport à µ sur B :
B B B
Z Z Z
f dµ = f+ dµ − f− dµ.
B B B
Si on dit f est intégrable, c'est qu'on veut implicitement dire sur

R R Ω, son ensemble de dénition.
Dans ce cas, on écrit aussi : f dµ = Ω
f dµ.
Dénition 4.14. Soit (Ω, T , µ) un espace mesuré, une fonction mesurable f : (Ω, T ) → C
intégrale par rapport à sur
l (resp.
f = (f1 , · · · , fn ) : (Ω, T ) → IRn )) est µ B ∈ T si ses parties réelles et
imaginaire Re f, Im f : (Ω, T ) → IR (resp. ses coordonnées fi ) sont intégrables sur B , i.e. de façon
Z
équivalente si |f |dµ < +∞. On note L1 (Ω, T , µ; C
l) l'ensemble des fonctions intégrables à valeur
B
C.
l
On pose alors :
Z Z Z Z Z Z
f dµ = Re f dµ + i Im f dµ ∈ C
l, (resp. f dµ = f1 dµ, · · · , fn dµ ∈ IRn )
B B B B B B
R R R R R
L'équivalence vient de
B
| Re f |dµ, B
| Im f |dµ ≤ B
|f |dµ ≤ B
| Re f |dµ + B
| Im f |dµ.
4.1 Premières propriétés

Lemme 4.28. Si f : (Ω, T , µ) → R est intégrable (sur Ω), alors µ({ω : |f |(ω) = +∞}) = 0
Démonstration.
R En eet, si A = {ω : |f |(ω) = +∞}, on a (+∞)1A ≤ |f | et donc +∞µ(A) ≤
B
|f |dµ < +∞ ce qui n'est possible que pour µ(A) = 0.
Lemme 4.29. Soit (Ω, T , µ) un espace mesuré, et f, g : (Ω, T ) → IK des fonctions intégrables sur
B ∈ T , alors
1. 1 f est intégrable sur Ω et R f dµ = R 1 f dµ.
2. (linéarité) Si α, β ∈ IK alors αf + βg est intégrable sur B et
B B Ω B
Z Z Z
αf + βgdµ = α f dµ + β gdµ.
B B B
3. (domination) Si h : (Ω, T ) → IK est mesurable et dominée par |f | au sens |h| ≤ |f | alors h

est intégrable sur B.
62
4. (inégalité triangulaire) Si IK = IR, on a :
Z Z
f dµ ≤ |f |dµ.
B B
On verra le cas complexe de l'inégalité triangulaire un peu plus loin.
RDémonstration.
R
1. Vu |1B f | = 1B |f |, |1 f |dµ =
en utilisant le cas positif du lemme 4.22, on a
Ω B
B
|f |dµ < +∞ d'où l'intégrabilité. Le calcul de l'intégral se déduit alors du même résultat en prenant
partie positive et négative des parties réelles et imaginaires.
2. Par l'inégalité triangulaire |αf + βg| ≤ |α||f | + |β||g|, donc en passant à l'intégrale et utilisant
le cas positif de la linéarité de l'intégrale (Corollaire 4.25) :
Z Z Z Z
|αf + βg|dµ ≤ |α||f | + |β||g|dµ = |α| |f |dµ + |β| |g|dµ < +∞.
B B B B
De même, l'égalité des intégrales vient en prenant partie positive et négative des parties réelles et
imaginaires.
R R
3. Il sut d'utiliser la monotonie de l'intégrale
B B
|h|dµ ≤ |f |dµ < +∞.
4. Dans le cas réel, on a utilise juste l'inégalité triangulaire :
Z Z Z Z Z Z
f dµ = f+ dµ − f− dµ ≤ f+ dµ + f− dµ = |f |dµ.
B B B B B B
4.2 Théorème de Convergence dominée de Lebesgue

Théorème 4.30. (Théorème de Convergence dominée ou TCD) Soient Z , Z : (Ω, T , µ) → IK des
fonctions mesurables et A ∈ T avec µ(A ) = 0 satisfaisant :
n
c
1. (Condition de domination) il existe une fonction Y intégrable (positive) telle que |Z | ≤ Y ,

2. pour tout ω ∈ A, Z (ω) → Z(ω)
n
alors on a :
n
1. ZR est intégrable
2. |Z − Z|dµ → 0
3. on peut intervertir limite et intégrale
Ω n
Z Z Z
lim Zn dµ = Zdµ = lim Zn dµ.
n→∞ Ω Ω A n→∞
Dénition 4.15. A∈T µ(Ac ) = 0, A

presque partout
Si une propriété est vraie sur un ensemble avec on dit que
est vraie .
L'hypothèse 2. se formule en disant que Zn converge vers Z presque partout. On étudiera cette
notion avec plus de détail au chapitre suivant.
63
Démonstration. En appliquant aux parties réelles et imaginaires, il sut de montrer le cas IK = IR.
1. L'inégalité |Zn | ≤ Y
implique en passant à la limite |Z| ≤ Y sur A, ou autrement dit par
c
domination, Z est intégrable sur A. Comme µ(A ) = 0, on a aussi |Z| ≤ Y + ∞1Ac et Y + ∞1Ac est
aussi intégrable, donc Z est même intégrable.
3. L'inégalité |Zn | ≤ Y se traduit aussi par Y − Zn , Zn + Y ≥ 0 et on peut appliquer le lemme de
Fatou 4.27 :
Z Z Z Z Z
(Y − Z)dµ = lim inf (Y − Zn )dµ ≤ lim inf (Y − Zn )dµ = Y dµ − lim sup Zn dµ,
A A n n A A n A
Z Z Z Z Z
(Y + Z)dµ = lim inf (Y + Zn )dµ ≤ lim inf (Y + Zn )dµ = Y dµ + lim inf Zn dµ,
A A n n A A n A
donc en soustrayant le terme en Y,
Z Z Z Z
Zdµ ≤ lim inf Zn dµ ≤ lim sup Zn dµ ≤ Zdµ
A n n A
et on en déduit donc l'égalité et la dernière convergence.
2. Enn, par l'inégalité triangulaire, on déduit |Zn − Z| ≤ |Zn | + |Z| ≤ 2Y sur A et il satisfait
la même condition de domination et pour tout
R R ω ∈ A, |Zn − Z|(ω) → 0. En appliquant le reste du
résultat, on obtient donc
Ω
|Zn − Z|dµ → Ω 0dµ = 0
Corollaire 4.31. (InterversionXSérie-intégrale : cas général) Soient f : ΩX→ IK une suite de n
fonctions mesurables telle que |f |dµ < ∞ pour B ∈ T , alors la somme f : Ω → IK existe
Z
n n
presque partout et est intégrable sur B et on a :

n≥0 B n≥0
Z X XZ
fn dµ = fn dµ.
B n≥0 n≥0 B
Démonstration. On considère la suite des sommes partielles

n
Sn = nk=0 fk qui vérie, grâce à l'inéga-
∞
P
X X
lité triangulaire, la condition de domination |Sk | ≤ |fk | ≤ |fk | =: Z . Or par le cas positif de
Z k=0 k=0
XZ
l'interversion, Zdµ = |fn |dµ < ∞ donc Z est intégrable sur B . Soit A = {ω ∈ B : Z(ω) <
B n≥0 B
P
∞}, de sorte que k fk converge absolument sur A donc Sn converge simplement vers la somme (qui
c
est donc mesurable par le théorème 4.18). Par le lemme 4.28 on a µ(A ) = 0 donc le TCD s'applique
(sur B à la place de Ω) et donne le résultat.
5 Théorème de transfert
Théorème 4.32 Soit f : (Ω, T , µ) → (E, E ) une fonction mesurable de
.
mesure image µ et h : (E, E ) → (IR, B(IR)) une autre fonction mesurable. Alors, si h est à valeur
(Théorème de transfert)
positive :
f
Z Z
(h ◦ f ) dµ = h(x) dµf (x).
De plus, siR h n'est pas àR valeur positive h ◦ f ∈ L (Ω, T , µ) si et seulement si h ∈ L (E, E , µ ) et

E
1 1
on a encore (h ◦ f )dµ = h(x)dµ (x).

f
f
64
Autrement dit, on ramène une intégrale sur Ω à une intégrale sur IR :
Z Z
h(f (ω))dµ(ω) = h(x)dµf (x).
Ω IR
Proof : On procède comme pour la construction de l'intégrale. Si h = 1B avec B ∈ E , h◦f = 1f −1 (B)

et donc Z Z
−1
h ◦ f dµ = µ(f (B)) = µf (B) = h(x)dµf (x).
Par linéarité, on obtient le cas de h étagé. Si h positive, h est la limite croissante d'une suite de fonc-
tions étagées hn (du lemme 4.21). Comme hn (x) → h(x) par construction, on applique le théorème
de convergence monotone aux deux mesures :
Z Z Z Z
h ◦ f dµ = lim (hn ◦ f )dµ = lim hn (x)dµf (x) = h(x)dµf (x).
n→∞ n→∞
Le dernier résultat du cas intégrable est évident par le cas positif pour l'équivalence et par linéarité
pour l'égalité.
Le résultat similaire suivant est important en probabilité. Nous avons vu la tribu engendrée par
f : σ(f ) au lemme 4.8. Le résultat suivant donne une interprétation concrète des fonctions σ(f )-
mesurables.
Proposition 4.33 (Lemme de Doob-Dynkin). Soit f une fonction mesurable, f : (Ω, T , µ) → (E, E ),
et soit σ(f ) = {A = f (B), B ∈ E } la tribu engendrée par f . Alors g : Ω → (IR , B(IR )) est σ(f )-
−1 n n
mesurable si et seulement si il existe h : (E, E ) → (IR , B(IR )) mesurable telle que g = h ◦ f.

n n
Proof : La condition susante est évidente car pour un borélien A, (h ◦ f )−1 (A) = f −1 (h−1 (A))
qui est mesurable car h (A) ∈ E
−1
car h borélienne et l'image inverse par f est alors par dénition
un élément de σ(f ). P
Réciproquement, on raisonne comme pour le transfert par le cas étagé g = i λi 1Ai et Ai =
f −1 (Bi ) et alors h = i λi 1Bi convient. Sinon, si g positive, on la prend pour limite simple de
P
gn
étagée de la forme hn ◦ f par le cas étagé, et on pose
h(x) = lim inf hn (x).

n→∞
h convient car mesurable positive (comme lim inf de fonctions mesurables) et car g(ω) = limn hn (f (ω)) =
h(f (ω)) vu qu'en f (ω) la suite (hn ) converge d'après le choix de gn . Le cas général se montre par
linéarité à partir du cas positif.
6 Comparaison aux constructions de L2

6.1 Intégrale de Riemann des fonctions continues par morceau
Comme on a vu au chapitre 2, la base de l'intégrale de Riemann est la notion de fonction en
escalier. Ce sont des combinaisons linéaires d'indicatrices d'intervalles de forme 1]a,b[ et 1{c} . Or les
intervalles sont des boréliens, donc les fonctions en escalier sont boréliennes étagées. On a
Z Z Z Z
1]a,b[ dλ = (b − a) = 1]a,b[ (x)dx, 1{c} dλ = 0 = 1{x} (x)dx,
65
donc par combinaison linéaire, intégrale de Riemann et de Lebesgue par rapport à la mesure de
Lebesgue coïncident.
Soit f continue par morceau sur [a, b], l'intégrale de Riemann est construite en choisissant fn en
escalier convergent uniformément vers f et donc simplement, donc f est borélienne comme limite
simple de fonctions boréliennes (cf. le théorème 4.18). De plus, elle est bornée donc intégrable sur
[a, b].
Quitte à décomposé en partie réelle et imaginaire, on suppose f réelle. DOnc pour tout x ∈ [a, b]
on a |f (x) − fn (x)| ≤ ||fn − f ||∞ soit
fn (x) − ||fn − f ||∞ ≤ f (x) ≤ fn (x) + ||fn − f ||∞ .
En intégrant au sens de Lebesgue, et en utilisant que les deux côtés coïncident avec celle de
Riemann, on obtient l'inégalité :
Z b Z Z b
fn (x)dx − ||fn − f ||∞ (b − a) ≤ f dλ ≤ fn (x)dx + ||fn − f ||∞ (b − a).
a [a,b] a
Rb Rb
En passant à la limite n → ∞, on a ||fn − f ||∞ → 0 et
a
fn (x)dx → a
f (x)dx par dénition de
l'intégrale de Riemann. On a donc obtenu :
Théorème 4.34. 1. Toute fonction continue par morceau sur un segment [a, b] est intégrable
par rapport à la mesure de Lebesgue λ et son intégrale de Riemann coïncide avec celle pour la
mesure de Lebesgue : Z Z b
f (x)dx = f dλ.
a [a,b]
2. Toute fonction continue par morceau sur un intervalle I (]a, b], ]a, b[ ou [a, b[) est
intégrable par rapport à la mesure Rde Lebesgue Rλ et son intégrale de Riemann coïncide avec
intégrable
celle pour la mesure de Lebesgue : f (x)dx = f dλ. a

b
[a,b]
On pourra donc appliquer les théorèmes précédents aux intégrales (de Riemann) usuelles vues en L2.
Remarque . 4.6 Pour les fonctions f : [a, b] → IR, on peut dénir une notion plus générale de fonc-
tion Riemann intégrable", elle même plus générale que l'intégrale des fonctions continues par mor-
http://math.
ceaux. L'intégrale de Lebesgue généralise aussi cette version plus générale, cf. e.g.
univ-lyon1.fr/homes-www/mironescu/resources/cours_mesure_integration.pdf section 6.8.1
6.2 Mesures à densité

Le résultat suivant est laissé en exercice
Proposition 4.35 (Mesures à densité (ou absolument continue)). Soit f : X → [0, +∞] une fonction
mesurable. On dénit une application ν : A → [0, +∞] par
Z
ν(A) = f dµ .
A
Alors, ν est une mesure sur X , appelée f par rapport à µ. De plus h est intégrable
par rapport à ν si et seulement si f h est intégrable par rapport à µ et :
mesure de densité
Z Z
hdν = f hdµ .
X X
66
Pour une mesure à densité ν par rapport à µ, si µ(A) = 0 alors ν(A) = 0. En fait, cette
propriété caractérise les mesures à densité (c'est un théorème beaucoup plus dur, le théorème de
Radon-Nikodym cf. section 5)
Exemple . 4.7 On peut dénir une mesure de probabilité sur les boréliens de IR en posant
Z
1 x2
µ(A) = √ e− 2 dλ(x) .
2π A
Cette mesure s'appelle la mesure gaussienne . C'est un exemple de probabilité à densité par rapport
à la mesure de Lebesgue. Pour vérier qu'il s'agit bien d'une probabilité, il faut vérier que :
Z
1 x2
µ(IR) = √ e− 2 dλ(x) = 1.
2π IR
On le vériera plus loin par changement de variable à la n du chapitre 5 à la formule (5.1)
6.3 Lien avec les Séries

Soit Ω un ensemble. On considère l'espace mesuré (Ω, P(Ω), ν). Tout fonction f : Ω → R est
P(Ω)-mesurable. On peut donc ignorer la mesurabilité pour le cas des séries.
Cas Ω = {ω1 , · · · , ωn } ni

n
X Z n
X
Toute fonction s'écrit f = f (ωk )1{ωk } et est donc étagée. On déduit que f dν = f (ωk ),
k=1 k=1 Ω
d'abord pour les fonctions étagées, puis positives, puis quelconques (on peut prendre toutes les limites
constantes).
Cas Ω = IN
1. Si f ≥ 0 alors f dν = f (n)
Z ∞
Lemme 4.36.
X
2. f est intégrable si et seulement si P f (n) est absolument convergente et encore

Ω n=0
Z ∞
X
f dν = f (n).
Ω n=0
Démonstration.
n
X
1) Soit fn = f (k)1{k} est une suite croissante de fonctions donc par le TCM
k=1
Z Z n
X ∞
X
f dν = lim fn dν = lim f (k) = f (n)
Ω n Ω n
k=0 n=0
∞
X
2) L'équivalence vient du 1) f est intégrable ssi |f | a une intégrale ni, donc ssi |f (n)| c'est
P n=0
à dire ssi f (n) est absolument convergente. La dénition de l'intégrale et de la somme coïncident
alors
Z Z Z ∞
X ∞
X ∞
X
f dν = f+ dν − f− dν = f (n)+ − f (n)− = f (n).
Ω Ω Ω n=0 n=0 n=0
67
Cas Ω = {ωn , n ∈ IN} dénombrable
On a ω : IN →Ω une bijection, donc la mesure image νω ({i}) = ν({ω −1 (i)} = 1 = ν({i}) est
encore la mesure de comptage, le théorème de transfert donne donc :
Lemme 4.37. Pour tout f : Ω → [0, +∞],

Z Z ∞
IN f (ω)dν = f (ω )
X
f dν = n
Ω n=0
En particulier, si σ : IN → IN est une bijection P f (σ(n)) = P f (n) et le même résultat est

∞ ∞
valide pour les séries absolument convergentes (on dit qu'elles sont n=0
.) n=0
Aussi L (Ω, ν) = ℓ (Ω) est l'ensemble des familles sommables sur Ω avec la norme 1.
commutativement convergentes
1 1
Probabilité discrète sur Ω = {ωn , n ∈ IN} dénombrable

R
P∞C'est une densité f : Ω → [0, +∞] par rapport à la mesure de comptage telle que
Ω
f dν =
n=0 f (ωn ) = 1.
7 Intégrales dépendant d'un paramètre

Soient (Ω, T , µ) un espace mesuré, E un evn. Soit nalement A une partie de E.
Dénition 4.16. Soit f : A × Ω → IK. On suppose que pour tout x ∈ A, t 7→ f (x, t) est intégrable
(soit dans L1R(Ω, T , µ)). Dans ce cas, on peut poser :
F (x) = Ω f (x, t)dµ(t). On dénit ainsi une intégrale dépendant d'un paramètre la fonction
F : A → IK.
Théorème 4.38. (Théorème de continuité avec hypothèse de domination)

Soit f : A × Ω → IK. On suppose :
1. Pour tout x ∈ A, t 7→ f (x, t), est mesurable sur Ω.
2. Pour tout presque tout t ∈ Ω, x 7→ f (x, t) est continue en x ∈ A.
3. (Hypothèse de domination) Il existe une fonction intégrable g : Ω → IR , g ∈ L (Ω, T , µ) telle
0
1
que
+
∀t ∈ Ω, ∀x ∈ A, |f (x, t)| ≤ g(t).

Alors la fonction x 7→ F (x) = R
Ω
f (x, t)dµ(t) est continue en x . 0
On remarquera que dans l'hypothèse de domination, la fonction g ne dépend PAS de x.

Démonstration. L'hypothèse de domination garantit que t 7→ f (x, t) est intégrable. Soit xn ∈ A
tel que xn → x0 . Par continuité de x 7→ f (x, t), pour chaque t, f (xn , t) → f (x0 , t). On peut donc
appliquer le théorème de convergence dominée (avec domination par g ) pour conclure
Z Z
lim f (xn , t)dµ(t) = f (x0 , t)dµ(t).
n→∞ Ω Ω
68
Exemple . f : → λ).
transformée de Fourier
4.8 (cf TD.) Soit IR C
l intégrable sur IR (par rapport à la mesure de Lebesgue
Sa est dénie par :
Z
fˆ(x) = f (t)eitx dt.
IR
Elle est continue sur IR en utilisant une domination par |f |.

Théorème 4.39. (Théorème de dérivabilité avec hypothèse de domination) Soit f : U × Ω → IK
avec U ⊂ IR un ouvert.
n
On suppose :
1. Pour tout x ∈ U , t 7→ f (x, t), est intégrable sur Ω.
2. Il existe N avec µ(N ) = 0, tel que pour tout t ∈ N , la fonction x 7→ f (x, t) admet une i-ème
c
dérivée partielle sur U .

3. (Hypothèse de domination) Pour tout compact K ⊂ U , il existe une fonction intégrable g ∈
L (Ω) telle que
K
1
∂f
∀t ∈ N, ∀x ∈ K, (x, t) ≤ gK (t).
∂xi
Alors la fonction x 7→ F (x) = R f (x, t)dµ(t) admet une i-ème dérivée partielle sur U , ∂f
∈ L1 (Ω)
et : Ω ∂xi
Z
∂F ∂f
(x) = (x, t)dµ(t).
∂xi Ω ∂xi
Remarque . 4.7 Soitf = (f1 , ..., fm ) : U × Ω → IRm avec U ⊂ IRn un ouvert. Si chaque fi (x, .) est
intégrable sur Ω pour tout x ∈ U , on peut dénir l'intégrale coordonnée par coordonnée :
Z Z Z
f (x, t)dµ(t) = ( f1 (x, t)dµ(t), · · · , fn (x, t)dµ(t)).
Ω Ω Ω
Alors le théorème s'applique en remplaçant la valeur absolue par la norme dans la domination (et en
appliquant le résultat coordonnée par coordonnée.)
Démonstration. On peut supposer n = m = 1 (car les dérivées partielles se calculent coordonnée par
c
coordonnée). On xe x0 et montre la dérivabilité en x0 . On pose h(x, t) = 0 si t ∈ N et pour t ∈ N
f (x, t) − f (x0 , t) ∂f
h(x, t) = , si x ̸= x0 et h(x0 , t) = (x0 , t).
x − x0 ∂x
Pour x ̸= x0 ,
F (x) − F (x0 )
Z
= h(x, t)dµ(t).
x − x0 Ω
R
Il sut donc de prouver que x 7→ h(x, t)dµ(t) est continue en x0 . Par hypothèse, t 7→ h(x, t)
Ω
est mesurable pour x ̸= x0 et par exemple en tant que lim inf (sur N ) aussi ex x0 et x 7→ h(x, t) est
continue pour t ∈ N (par continuité d'une fonction dérivable d'une variable). Enn l'inégalité des
accroissements nis à x 7→ f (x, t) donne, pour x ̸= x0 , x ∈ K = [x0 − ϵ, x0 + ϵ] ⊂ U (un compact car
fermé borné de IR contenu dans U pour ϵ assez petit) :
∂f
||h(x, t)|| ≤ sup (u, t) ≤ gK (t).
u∈[x0 ,x] ∂xi
69
La même inégalité étant évidente en x0 , on a la condition de domination et le théorème de continuité
appliqué à K conclut.
Corollaire 4.40. (Théorème de dérivation successive) Soit f : U × V → IR avec U ⊂ IR , V ⊂ IR l n m
des ouverts, une fonction C (k ∈ IN × {∞}). Soit µ une mesure sur une tribu T ⊃ B(V ).
k
On suppose qu'il existe ϕ , ϕ , ..., ϕ µ-intégrables sur V telles que ||f (x, t)|| ≤ ϕ (t) et
0 1 k 0
∂ pf
∀(i1 , ..., in ), i1 + ... + in = p ≤ k, ∀x ∈ U, ∀t ∈ I (x, t) ≤ ϕp (t).
∂xi11 ...∂xinn
Alors la fonction x 7→ F (x) = R f (x, t)dµ(t)
V
est de classe sur et pour p = i + ... + i
Ck U 1 n ≤k :
∂ pF ∂ pf
Z
(x) = (x, t)dµ(t).
∂xi11 ...∂xinn i1 in
V ∂x1 ...∂xn
Démonstration. Il sut d'appliquer le théorème de dérivation avec condition de domination par

récurrence simple (coordonnées fi par coordonnée f = (f1 , · · · , fn )) . La mesurabilité de f vient de
sa continuité vu que T contient les boréliens. Son intégrabilité vient de la domination |f (x, t)| ≤ ϕ0 (t)
et sur les autres dérivées successives des autres dominations. On peut prendre N = ∅.
7.1 Un exemple : la transformée de Fourier d'une mesure avec moments

d'ordre 2.
Soit µ une mesure (de masse) nie sur B(IRn ) (par exemple une probabilité à densité par rapport
à λ) tel que xi , xi xj , i, j = 1, · · · , n sont intégrables c'est à dire :
Z Z
n
|xi |dµ(x) < +∞, n
|xi xj |dµ(x) < +∞.
IR IR
On verra plus tard grâce à l'inégalité de Cauchy-Schwarz qu'il sut de supposer x2i intégrable. On
reprend la transformée de Fourier vu en TD et à l'exemple 4.8 qui est dénie par :
Z Z
i⟨ξ,x⟩
µ̂(ξ) = n
e dµ(x) = f (ξ, x)dµ(x), f (ξ, x) = ei⟨ξ,x⟩ .
IR IR
2n
f est C2 (même C ∞) sur IR et vérie les dominations :
|f (ξ, x)| ≤ 1
∂ ∂
f (ξ, x) = ixi ei⟨ξ,x⟩ , f (ξ, x) ≤ |xi |
∂ξi ∂ξi
∂2 ∂2
f (ξ, x) = −xi xj ei⟨ξ,x⟩ , f (ξ, x) ≤ |xi xj |
∂ξi ∂ξj ∂ξi ∂ξj
et par l'hypothèse µ de masse nie, 1 est intégrable et par les hypothèses d'intégrabilité, les autres
membres de droite des dominations sont intégrables aussi par rapport à µ. Par le théorème de
2
dérivation avec condition de domination, on déduit donc que µ̂ est C et :
∂2
Z Z
∂ i⟨ξ,x⟩
µ̂(ξ) = i xi e dµ(x) µ̂(ξ) = − xi xj ei⟨ξ,x⟩ dµ(x).
∂ξi IR
n
∂ξi ∂ξj IR
n
n
Cet exemple sera utilisé au S6 pour montrer le Théorème centrale limite dans IR .
70
Chapitre 5
Intégration avancée : Théorème de Fubini,
Changements de variables
1 Mesure produit et théorèmes de Fubini

1.1 Tribus produits
La méthode de base pour calculer une intégrale d'une fonction de 2 variables est de se ramener
à des intégrales de fonctions de 1 variable. Pour cela il nous faut d'abord expliquer comment on
peut munir X ×Y d'une structure d'espace mesuré quand X, Y sont tous les deux munis d'une telle
structure.
Dénition 5.1. (X, A, µ1 ) et (Y, B, µ2 ) deux espaces mesurés σ -nis. On note A ⊗ B la tribu
tribu produit
Soient
engendrée par les parties de la forme A × B , où A ∈ A, B ∈ B ; on l'appelle des tribus
A et B.
Lemme 5.1. Si A = σ(E) et B = σ(F), on a A ⊗ B = σ {E × F, E ∈ E, F ∈ F} .

En particulier, B(IR ) = B(IR ) ⊗ B(IR ). De plus, si f : (X, A) → (Z, C) et g : (Y, B) →

n+m n m
(Z, D) sont mesurables, l'application (f, g) : (X ×Y, A⊗B) → (Z ×T, C ⊗D) dénie par (f, g)(x, y) =
(f (x), g(y)) est mesurable.
Démonstration.
Vu {E × F, E ∈ E, F ∈ F} ⊂ A ⊗ B , on obtient en passant à la tribu engendrée
G := σ {E × F, E ∈ E, F ∈ F} ⊂ A ⊗ B .
′ ′
Réciproquement, on pose A = {A ∈ A : ∀F ∈ F, A × F ∈ G}. On a clairement que A contient
E et on vérie facilement que c'est une tribu (vu que Ac × F = (Ω × F ) − (A × F ) ∈ G pour F ∈ F .)
′ ′
D'où A = σ(E) = A. De même, on pose ensuite, B = {B ∈ B : ∀A ∈ A, A × B ∈ G} et on déduit
′ ′ ′
du point précédent que F ⊂ B ⊂ B et comme avant que B est une tribu d'où B = B . Finalement,
on a donc A × B ⊂ G d'où l'inclusion complémentaire de tribus.
n+m
Le cas particulier B(IR ) = B(IRn )⊗B(IRm) est une conséquence immédiate
du Corollaire 4.16.
Pour le dernier point, comme C ⊗ D = σ {E × F, E ∈ C, F ∈ D} il sut de noter que
(f, g)−1 (E × F ) = f −1 (E) × g −1 (F ) ∈ A × B ⊂ A ⊗ B et le lemme 4.13 conclut.
71
1.2 Mesure produit
Théorème 5.2 Soient (Ω , T , µ ) et (Ω , T , µ ) deux espaces me-
.
surés σ-nis. Alors il existe une unique mesure ν sur T ⊗ T vériant
(dénissant la mesure produit) 1 1 1 2 2 2
1 2
ν(A × B) = µ1 (A)µ2 (B)

pour tout A ∈ T et tout B ∈ T (avec la convention usuelle 0.(+∞) = 0). Cette mesure est notée
µ ⊗ µ = ν , et est σ -nie.
1 2
1 2
Exemple . λ 5.1 Si
n
λ = λ ⊗λ
n désigne la mesure de Lebesgue sur IR , alors on a toujours n+m n m . On
applique le corollaire 4.19 au lemme de classe monotone à l'ensemble des pavés E . Par dénition,
λn+m , λn ⊗ λm coïncident sur les pavés. Or ∪M ∈IN [−M, M ]n+m = Rn+m et λn+m ([−M, M ]n+m ) =
(2M )n+m = (λn ⊗ λm )([−M, M ]n+m ) < +∞ donc on conclut à l'égalité voulue.
La preuve va être basée sur le fait de montrer un cas particulier du théorème de Fubini suivant
pour les fonctions indicatrices.
Démonstration. Unicité On applique le même corollaire 4.19 au lemme de classe monotone. ON

prend E = {A × B, A ∈ T1 , B ∈ T2 } qui engendre T1 ⊗ T2 par dénition. Deux mesures ν1 , ν2 vériant
le théorème coïncident sur E . Or comme µ1 , µ2 sont σ -nies, on obtient Ωi = ∪n Ai,n avec Ai,n ∈ Ti
et µi (Ai,n ) < +∞. Alors, on a A1,n × A2,n ∈ E et est de mesure µ1 (A1,n )µ2 (A2,n ) < +∞ pour ν1 , ν2 .
Ceci donne la dernière hypothèse du corollaire 4.19 qui conclut à µ1 = µ2 .
Existence Pour C ∈ T1 ⊗ T2 , on pose Cx = {y ∈ Ω2 : (x, y) ∈ C}. On cherche à voir que Cx ∈ T2 .
Supposons d'abord µ2 nie. On considère
C = {C ∈ T1 ⊗ T2 : Cx ∈ T2 et x 7→ µ2 (Cx ) est T1 − mesurable}.

Alors on a
C contient les pavés mesurables C = A×B avec A ∈ T1 , B ∈ T2 car (A × B)x ∈ {∅, B} en
distinguant le cas x ∈ A, x ̸∈ A
donc µ2 (Cx ) = 1A (x)µ2 (B).
′ ′ ′ ′
C est une classe monotone car si C ⊂ C, C ∈ C (C \ C )x = Cx \ Cx d'où la mesurabilité
′ ′
et µ2 (C \ C )x = µ2 (Cx ) − µ2 (Cx ) par nitude de µ2 qui est mesurable par diérence donc
C \ C ′ ∈ C . De même si Cn est une suite croissante (∪n Cn )x = ∪n (Cn )x qui est dans T2 et
µ2 ((∪n Cn )x ) = supn µ2 ((Cn )x ) est bien mesurable.
Donc C contient la classe monotone engendrée par les pavés, donc (par le lemme de classe monotone)
est égale à T1 ⊗ T2 .
Si µ2 est σ -nie, on regarde les mesures induites et déduit le même résultat de mesurabilité de
µ2 (Cx ) par limite croissante.
On peut donc poser Z
ν(C) = µ2 (Cx )dµ1 (x).
Ω1
n
Il faut voir que c'est une mesure en montrant la σ -additivité : Soient C des ensembles mesurables
n
disjoints, (en utilisant qu'alors les Cx sont disjoints), il sut d'utiliser l'interversion série intégrale :
Z Z X XZ X
n
ν(∪n C ) = µ2 (∪n Cxn )dµ1 (x) = µ2 (Cxn )dµ1 (x) = µ2 (Cxn )dµ1 (x) = ν(C n ).
Ω1 Ω1 n n Ω1 n
Enn, ν convient par le calcul précédent de µ2 ((A × B)x ) :

Z
ν(A × B) = 1A (x)µ2 (B)dµ1 (x) = µ1 (A)µ2 (B).
Ω1
72
1.3 Théorème de Fubini-Tonelli et Fubini (admis)
La mesure produit µ1 ⊗ µ2 µ1 et µ2 , on s'attend à ce qu'il en soit de même
étant dénie à partir de
1
de l'intégrale d'une fonction mesurable relativement à µ1 ⊗ µ2 . Et c'est eectivement le contenu des
théorèmes de Fubini. On commence par le cas positif.
Théorème 5.3 (FubiniTonelli). Soient (Ω1 , T1 , µ1 ) et (Ω2 , T2 , µ2 ) deux espaces mesurés σ-nis. Soit
f : Ω1 × Ω2 → [0, +∞] une fonction T ⊗ T -mesurable. Alors :
1. y 7→ Zf (x, y) est une fonction mesurable (sur (Ω , T ) dans [0, +∞] ) pour tout x ∈ Ω , et
1 2
2 2 1
x 7→ f (x, y)dµ (y) est une fonction mesurable (sur (Ω , T )).

2 1 1
2. x 7→Zf (x, y) est une fonction mesurable (sur (Ω , T ) dans [0, +∞]) pour tout y ∈ Ω , et
Ω2
1 1 2
y 7→ f (x, y)dµ (x) est une fonction mesurable (sur (Ω , T )).

1 2 2
3. On a
Ω1
Z Z Z Z Z
f (x, y)dµ1 ⊗µ2 (x, y) = f (x, y)dµ2 (y) dµ1 (x) = f (x, y)dµ1 (x) dµ2 (y) .
Ω1 ×Ω2 Ω1 Ω2 Ω2 Ω1
Exercice . 5.1 Calculer l'aire du disque unité D = {(x, y) ∈ IR2 : x2 + y 2 ≤ 1}.

n
Comme dans le cas des fonctions dénies sur IR , on en déduit facilement un théorème qui
s'applique à toutes les fonctions intégrables (et pour vérier qu'une fonction est intégrable, on peut
commencer par appliquer le théorème de FubiniTonelli à |f |).
Théorème 5.4 (Fubini). Soient (Ω1 , T1 , µ1 ) et (Ω2 , T2 , µ2 ) deux espaces mesurés σ-nis. Soit f : Ω1 ×
Ω2 → IR une fonction . Alors :
intégrable
1. y 7→ f (x, y) est une fonction intégrable (sur Ω ) pour presque tout x ∈ Ω , et x 7→

Z
2 1 f (x, y)dµ2 (y)
est une fonction intégrable (sur Ω ). 1
Ω2
2. x 7→ f (x, y) est une fonction intégrable (sur Ω ) pour presque tout y ∈ Ω , et y 7→

Z
1 2 f (x, y)dµ1 (x)
est une fonction intégrable (sur Ω ) Ω1
3. On a
2
Z Z Z Z Z
f (x, y)dµ1 ⊗µ2 (x, y) = f (x, y)dµ2 (y) dµ1 (x) = f (x, y)dµ1 (x) dµ2 (y) .
Ω1 ×Ω2 Ω1 Ω2 Ω2 Ω1
Exercice . 5.2 Soit f, g des fonctions mesurables positives sur IR, on dénit la convolution de f, g par :
Z
f ∗ g(x) = f (x − y)g(y)dλ(y) ∈ [0, ∞].
IR
On rappelle que Z
||f ||1 = |f (x)|dλ(x).
IR
1. Montrer que f ∗g est mesurable et que
||f ∗ g||1 = ||f ||1 ||g||1 .

1. Cette sous-section reprend le cours de l'an dernier de T. Blossier, M. Carrizosa et J. Melleray.
73
2. Montrer que la dénition de f ∗g s'étend pour presque tout x au f, g ∈ L1 (IR, dλ) et que
f ∗ g ∈ L1 (IR, dλ).
3. Montrer que pour f, g, h toutes mesurables positives ou toutes intégrables, alors
f ∗ (g ∗ h) = (f ∗ g) ∗ h.
2 Une Inégalité de convexité : l'Inégalité de Jensen

2
La convexité (ou la concavité) est souvent utilisée pour établir des inégalités.
Voyons maintenant l'inégalité de convexité la plus importante de notre cours.
Théorème 5.5 Soit (X, A, µ) un espace de probabilité, g une fonction µ-

.
intégrable à valeurs dans un intervalle IZ, et φ : I → ZIR une fonction convexe. Alors on a
(Inégalité de Jensen)
φ gdµ ≤ φ ◦ gdµ
X X
(l'intégrale de droite peut être égale à +∞ !).

Démonstration. D'abord, par le théorème 3.9, φ est dérivable à droite et à gauche, donc continue
sur l'intérieur de
R I , donc borélienne sur I (exo) donc la composée φ ◦ g est bien mesurable. Posons
m = gdµ . Notons que m ∈ I . En eet I est dénie par une ou deux inégalités, I = I1 ∩ I2
X
avec (I1 = {x : x ≥ a} ou I1 = {x : x > a} ou I1 = IR) et de même (I2 = {x : x ≤ b} ou
I2 = {x : x < b} ou I2 = IR). Expliquons d'abord R que si gR est à valeur dans I1 = {x : x ≥ a}, alors
comme l'intégrale préserve les inégalités larges
XR gdµ ≥ X adµ = a car µ(X)R = 1 et donc m R ∈ I1 .
De même si I1 = {x : x > a} si on n'avait pas gdµ > a, on aurait donc X gdµ = a = X adµ
R X
donc
X
(g − a)dµ = 0 mais alors g − a serait nulle µ-presque partout, donc {x ∈ X : g(x) > a} = X
serait de mesure nulle, contredisant l'hypothèse que X est un espace de probabilité. On conclut donc
R
aussi dans ce cas
X
gdµ ∈ I1 . On raisonne pareil pour I2 (ou on applique le premier cas à −g pour
changer le sens des inégalités).
Maintenant qu'on a vu que
R m ∈ I , on distingue 3 cas. Si jamais m est le minimum de I (s'il
existe !) alors on a
X
(g − m)dµ = 0 et g − m ≥ 0, donc g−m est nulle presque partout, par
conséquent on a Z
Z Z
φ ◦ gdµ = φ(m)dµ = φ(m) = φ gdµ .
X X X
On traite de même le cas où m est le maximum de I; nalement, le cas qui nous reste est celui où
m appartient à l'intérieur de I .
′
Alors, on sait que φg (m) existe et en posant α = φ′g (m), le théorème 3.9 donne que
∀t ∈ I φ(t) − φ(m) ≥ α(t − m) .

En particulier, pour tout x∈X on a φ(g(x)) ≥ φ(m) + α(g(x) − m). Comme g est intégrable et
les fonctions constantes sont intégrables (car µ est nie), donc la borne inférieure est intégrable, et
on en déduit que la partie négative de φ ◦ g est d'intégrale nie ; et en intégrant cette inégalité, on
obtient aussi que
Z Z Z Z
φ ◦ gdµ ≥ φ(m)dµ + α (g − m)dµ = φ(m) + α( gdµ − m) = φ(m) .
X X X X
2. Cette partie reprend le cours de 2018-2019 de T. Blossier, M. Carrizosa et J. Melleray.
74
Le corollaire suivant est un cas (très) particulier de l'inégalité de Jensen, qui peut se montrer
élémentairement, sans théorie de la mesure.
Corollaire 5.6. Soit I un intervalle de IR, α , . . . , α des réels positifs tels que P n
αi = 1 , et φ
une fonction convexe sur I . Alors, pour tout x , . . . , x ∈ I on a
1 n i=1
1 n
n
! n
X X
i=1 i=1
Démonstration. On xe x1 , . . . , x n ∈ I
et on considère l'espace mesuré d'ensemble sous-jacent X =
{x1 , . . . , xn }, où toutes les parties sont mesurables et µ = ni=1 αi δxi , où δxi désigne la mesure de
P
Dirac en xi . Alors µ est une mesure de probabilité ; de plus pour toute fonction g : X → IR on a
Z n
X
gdµ = αi g(xi ) .
X i=1
Z n
X Z
En considérant pour g la fonction identité, on a donc φ ◦ gdµ = αi φ(xi ), et gdµ =
X i=1 X
n
X
αi xi . L'inégalité de Jensen nous donne donc comme attendu
i=1
n
! n
X X
i=1 i=1
Remarque . 5.1 Dans le corollaire ci-dessus, le cas n = 2 correspond exactement à la dénition de

la convexité. En particulier, une application φ qui satisfait l'inégalité de Jensen pour toute fonction
intégrable sur un espace de probabilité, est nécessairement convexe.
3 Théorème de changement de variables

En pratique, pour calculer une intégrale multiple, on est souvent amené à faire un changement
de variables pour se ramener à un domaine plus simple sur lequel appliquer le théorème de Fubini.
diéomorphismes de classe
On énonce le théorème dans le cadre le plus courant où les fonctions que l'on peut utiliser pour faire
un changement de variables sont les C 1.
3.1 Cas ane

On commence par montrer le cas des fonctions anes. Nous allons baser la preuve sur une
caractérisation de la mesure de Lebesgue :
Théorème 5.7. (admis) La mesure de Lebesgue sur R est invariante par translation, au sens où
n
pour tout A ∈ B(R ) et tout x ∈ R , on a λ (x + A) = λ (A) avec x + A := {x + a, a ∈ A}.

n n
Inversement, si µ est une mesure sur (R , B(IR )) nie sur les parties bornées et invariante par
n n
n n
translation, alors il existe une constante c ≥ 0 telle que µ = cλ . n
75
Exercice . 5.3 On cherche à montrer l'unicité. On pose c = µ([0, 1[n ). Montrer en utilisant des recou-
vrements par des translations d'un ensemble xé que
1. µ([0, m1 [n ) = c m1n
2. pour a1 , ..., an ≥ 0, on a
n Qn
Y ⌊mai⌋ ⌊mai⌋
µ( [0, [) = c i=1 n
i=1
m m
µ( ni=1 [ai , bi [) = c ni=1 (bi − ai )

Q Q
En déduire que et conclure (en utilisant un corollaire du lemme de
classe monotone).
Lemme 5.8. Soit b ∈ IR et A ∈ M (IR) une matrice inversible. On pose f (x) = Ax + b avec
n
f : IR → IR , alors pour tout borélien B de IR , on a :

n
n n n
λn (f (B)) = |det(A)|λn (B).
Exercice . 5.4 Si A n'est pas inversible montrer que λ(f (B)) = 0. (Indication : on pourra montrer
que f (B) est inclus dans un hyperplan ane, i.e. un sous-espace ane de dimension n − 1, dans le
cas b = 0 dans un s.e.v. de dimension n − 1).
Démonstration. f (B) = (f −1 −1
) (B) est bien borélien car f −1 est linéaire (en dimension nie donc)
−1
continue donc borélienne. De même λ(f (·)) = f .λ est la mesure image par f −1 donc c'est bien une
mesure nie sur les parties bornées (car f (B) est borné pour tout borné B , cf chapitre 3 f (B(0, M )) ⊂
B(0, ||b|| + M |||f |||) avec |||f ||| la norme subordonnée de f ). Montrons qu'elle est invariante par
translation.
a ∈ IRn λn (f (a+B)) = λn (b+A(a+B)) = λn (Aa+f (B)) = λn (f (B)) par invariance par
On a pour
translation de la mesure de Lebesgue. Le théorème précédent montre donc que λn (f (B)) = cλn (B)
pour tout borélien B . Il sut donc de bien choisir le borélien pour chaque A pour montrer que
c = |det(A)|.
Par décomposition polaire, une matrice réelle s'écrit A = OS avec O orthogonale et S symétrique.
t
Cette matrice S peut se diagonaliser en base orthogonale S = O2 DO2 donc, ensemble, cela donne
t
une décomposition A = O1 DO2 où O1 = OO2 , O2 sont orthogonales et D est diagonale réelle.
Comme λn est invariante par translation, on est donc ramené au cas b = 0.
On est donc ramener au deux cas A orthogonale et A diagonale inversible.
Si A orthogonale, alors on choisit la boule unité euclidienne B = Bn car une matrice orthogonale
laisse invariante cette boule (c'est par dénition une isométrie pour la norme euclidienne) donc
λn (f (Bn )) = λn (Bn ) et c = 1 = |det(A)| (vu AAt = I , det(A)2 = det(A)det(A t
) = det(I) = 1).
n
Q n
Si A = diag(d1 , ..., dn ) alors on prend B = [0, 1] car A(B) = i=1 [0, di ] avec [0, di ] = [di , 0] si
di < 0. Dans tous les cas λn (A(B)) = ni=1 |di | = |det(A)|λ(B) comme voulu.
Q
Dans le cas général, A = O1 SO2 , par composition, on obtient :
λ(A(B)) = |det(O1 )||det(D)| det(O2 )|λ(B) = | det(A)|λ(B).
3.2 Rappel (de L2) sur les diéomorphismes

Dénition 5.2. U ⊂ IRn , V ⊂ IRp . Une application f : U → V une fonction diérentiable. f
diéomorphisme
Soient
−1
si f est bijective et que f
-diéomorphisme
est un est diérentiable.
k ∗ −1 k
On dit que f est un C (k ∈ IN ∪ ∞) si de plus f et f sont de classe C .
76
Proposition 5.9. Soit f : U → V un diéomorphisme, alors ∀x ∈ U , df (x) : IR n
→ IR est un
p
isomorphisme linéaire (en particulier nécessairement n = p) et on a :

(df (x))−1 = df −1 (f (x)).
Remarque . 5.2 1. Le résultat précédent montre que la dimension est invariante par diéomor-
n p
phisme. De même des ouverts de IR et IR ne peuvent être homéomorphes que si n = p mais
c'est beaucoup plus dur (Théorème d'invariance du domaine de Brouwer). Par contre, il existe
2
des applications continues surjectives de [0, 1] dans [0, 1] .
2. Le théorème d'inversion locale va donner des conditions pour la réciproque de la proposition

précédente
Démonstration. Comme f −1 ◦ f (y) = y , en diérenciant f −1 ◦ f par le théorème des fonctions

−1
composées en x, on obtient : df (f (x)) ◦ df (x) = id.
−1
De même en diérenciant f ◦ f (y) = y en z = f (x) on obtient : df (f −1 (z)) ◦ df −1 (z) = Id.
−1
Donc df (x) et df (f (x)) sont inverses l'une de l'autre, ce qui conclut.
Dénition 5.3. Soit f : U → IR

p
une application diérentiable sur un ouvert U ⊂ Rn . f (x) =
n p
(f1 (x), ..., fp (x)). df (x)
matrice jacobienne
La matrice de l'application linéaire dans les bases canoniques de IR et IR
est appelée, de f et notée J(f )(x) :
∂fi
(J(f )(x))ij = ( (x)).
∂xj
Remarque . 5.3 Le théorème de dérivation des fonctions composées donne donc :
J(g ◦ f )(x0 ) = J(g)(f (x0 ))J(f )(x0 ),
et le résultat pour les inverses de la proposition précédente s'écrit :
J(f −1 )(y0 ) = [J(f )(f −1 (y0 ))]−1 .
Le théorème suivant avec k=1 permettra de vérier l'hypothèse du théorème de changement de

variable.
Théorème 5.10. (d'inversion globale) Soit f : U → IRn une application de classe C k (avec k ≥ 1)
injective et telle que pour tout x ∈ U , df (x) : IR → IR est un isomorphisme linéaire, alors f (U )
n n
est un ouvert de IR et f : U → f (U ) est un C -diéomorphisme.

n k
Remarque . df (x)
5.4 det(Jf (x)) ̸= 0.
est un isomorphisme si et seulement si
3.3 Cas général (admis)

3
Nous pouvons maintenant énoncer le théorème de changement de variables.
Théorème 5.11 Soient U, V deux ouverts de IR , et

. n
φ : U → V un diéomorphisme de classe C . Rappelons qu'on note λ la mesure de Lebesgue sur

(Théorème de changement de variables)
1
IR . Alors on a :
n
n
77
1. Pour toute partie B borélienne de U , λ (φ(B)) = .
Z
n | det(Jφ(x))|dλn (x)
2. Si f : V → [0, +∞] est borélienne, alors

B
Z Z
f (x)dλn (x) = f ◦ φ(y)| det(Jφ(y))|dλn (y) .
V U
3. Si f : V → IR est intégrable, alors y 7→ f ◦ φ(y)| det(Jφ(y))| est intégrable sur U et on a

Z Z
f (x)dλn (x) = f ◦ φ(y)| det(Jφ(y))|dλn (y) .
V U
Remarque . −1
5.5 Le cas ane est une conséquence du lemme 5.8 et du théorème de transfert appliqué
f =φ : (V, B(V ), λn ) → (U, B(U )). Le 1 du théorème ou le lemme 5.8 ci-dessus, s'interprète comme
le calcul de la mesure image de la mesure de Lebesgue induite sur V : (λn,V )X ayant une densité
fX (x) = | det(Jφ(x))|1U (x) par rapport à λn . Le résultat correspond à h = f ◦ φ de sorte que :
Z Z Z Z
f dλn = h(X)dλn = n
h(y)fX (y)dλn (y) = f ◦ φ(y)| det(Jφ(y))|dλn (y).
V V IR U
Exemple
2
.
5.2 (changement de variables en polaires) On considère l'application ϕ : U =]0, +∞[×]0, 2π[→
IR ϕ(r, θ) = (r cos θ, r sin θ).
dénie par

cos θ −r sin θ
Alors, la matrice jacobienne de ϕ est , de déterminant r .
sin θ r cos θ
2
De plus, ϕ est injective et ϕ(U ) = IR \ ([0, +∞[×{0}) = V .
1 2 2
Ainsi, ϕ est un C -diéomorphisme de U sur V . Comme λ2 (IR \ V ) = 0, c'est-à-dire IR \ V est
2
négligeable, il n'est pas gênant que ϕ ne soit pas un diéomorphisme de U sur IR tout entier.
Par exemple, calculons
Z
I= (x + y)2 dxdy , où D = {(x, y) : x2 + y 2 < 1}.
D
En utilisant le théorème de changement de variables avec les coordonnées polaires (et le théorème de
−1
Fubini), on obtient ϕ (D ∩ V ) =]0, 1[×]0, 2π[ et
Z
I = (x + y)2 dxdy
ZD∩V
= (r cos θ + r sin θ)2 rdrdθ
ϕ−1 (D∩V )
Z 1 Z 2π
3 2 2
= r (cos θ + sin θ + 2 cos θ sin θ)dθ dr
0 0
Z 1 Z 2π
3
= r (1 + sin 2θ)dθ dr
0 0
Z 1
= 2πr3 dr
0
π
= .
2
78
Exemple .5.3 Calculons Γ( 12 ) =
0
R +∞
t−1/2 e−t dt.
On commence par le changement de variable (pour les intégrales à une variable) u2 = t, dt = 2udu :
Z +∞ Z +∞ Z +∞
1 −1/2 −t −u2 2
Γ( ) = t e dt = 2 e du = e−u du
2 0 0 −∞
2
avec la dernière égalité venant de la parité de la fonction u 7→ e−u .
Enn, on calcule le carré de cette intégrale en utilisant d'abord Fubini-Tonelli pour obtenir une
2 c
intégrale double (on utilise IR \ ({0} × [0, +∞[) = V vériant λ2 (V ) = 0 comme à l'exemple
précédent).
Z +∞ Z +∞ Z Z
1 −x2 −y 2 −x2 −y 2 2 −y 2
(Γ( ))2 = dx dy e = dxdy e = dxdy e−x
2 −∞ −∞ IR
2
V
d'où par changement de variable en coordonnée polaire (comme à l'exemple précédent on utilise
ϕ−1 (V ) = U pour le domaine d'intégration) :
Z 2π Z +∞ Z 2π h
1 −r2 2
i+∞ 1
(Γ( ))2 = dθ dre 2r/2 = dθ1 −e−r /2 = (2π). = π.
2 0 0 0 0 2
On a aussi vérier que

Z +∞ √
2
e−u du = π.
−∞
√
En faisant, le changement de variable linéaire u = x/ 2, on obtient :
Z +∞ √
1 2 /2
√ e−x dx = π. (5.1)
2 −∞
79
Chapitre 6
Introduction aux espaces Lp
Soit (Ω, T , µ) un espace mesuré (Tla tribu, µ la mesure). On va travailler en identiant les
fonctions si elles coïncident µ-presque partout. Autrement dit, on écrira f = g quand µ({x : f (x) ̸=
g(x)}) = 0 ; en particulier, f = 0 signiera que f vaut 0 presque partout. Par exemple, si f est la
l on pourra écrire f = 0. Ainsi, dit en mots, on va en fait travailler avec
fonction caractéristique de Q,
les classes d'équivalence de fonctions à égalité µ-presque partout près". IK sera égale à IR ou C.
l
1 L'espace L∞(Ω, µ)
Dénition 6.1. Soit f : Ω → IK M ∈ [0, +∞[ est une borne
essentielle essentiellement bornée
une fonction mesurable. On dit que
def ou que f est par M si µ({x : |f (x)| > M }) = 0, autrement
dit, si f ≤ M µ-presque partout.
On dénit leur ensemble :
L∞ (Ω, T , µ; IK) = {f˙; f : Ω → IK, mesurable et ∃C < ∞ : |f | ≤ Cµ − p.p.}
et la fonction (qui est une norme selon le lemme suivant) :
||f ||∞ = inf{C : |f | ≤ Cµ − p.p.} =: ess suppx∈Ω |f (x)|.

On note aussi plus brièvement L∞ (Ω; IK) = L∞ (Ω, µ; IK) = L∞ (Ω, T , µ; IK) et L∞ (Ω) = L∞ (Ω; IR),
si il n'y a pas de confusion possible.
Exercice . 6.1 (cf TD) Montrer que |f | ≤ ||f ||∞ p.p.
Lemme 6.1. (L∞ (Ω, T , µ; IK), || · ||∞ ) est un espace vectoriel normé.
Démonstration. On montre qu'il s'agit d'un sous-espace vectoriel de l'espace des classes d'équiva-
lences de fonctions mesurables. Bien sûr 0 est bornée donc essentiellement bornée.
∞
Soient f, g ∈ L (Ω, T , µ; IK), λ ∈ IK. Par l'exo
µ({ω : |f (ω)| > ||f ||∞ }) = 0, µ({ω : |g(ω)| > ||g||∞ }) = 0.
Or par l'inégalité triangulaire des nombres on a :|(λf + g)(ω)| ≤ |λ||f (ω)| + |g(ω)| donc {ω :
|f (ω)| ≤ ||f ||∞ } ∩ {ω : |g(ω)| ≤ ||g||∞ } ⊂ {ω : |(λf + g)(ω)| ≤ |λ|||f ||∞ + ||g||∞ } et en passant au
complémentaire
80
µ({ω : |(λf + g)(ω)| > |λ|||f ||∞ + ||g||∞ }) ≤ µ({ω : |f (ω)| > ||f ||∞ }) + µ({ω : |g(ω)| > ||g||∞ }) = 0
Donc, par dénition, λf + g est essentiellement bornée et ||λf + g||∞ ≤ |λ|||f ||∞ + ||g||∞ . On
déduit queL∞ (Ω; IK) est bien un espace vectoriel et l'inégalité triangulaire. En fait µ({ω : |f (ω)| >
C}) = µ({ω : |λf (ω)| > |λ|C}) donc en comparant les inma, ||λf ||∞ = |λ| ||f ||∞ ce qui donne la
positive homogénéité. Enn par dénition, si ||f ||∞ = 0 alors f = 0 presque partout donc sa classe
d'équivalence est nulle.
Théorème 6.2. (L∞ (Ω, T , µ; IK), || · ||∞ ) est un espace de Banach.

Démonstration. Il reste à montrer la complétude : Soit fn une suite de Cauchy de fonctions me-
surables essentiellement bornées. Montrons que que fn converge vers f (ω) = lim supn→∞ fn (ω) qui
est une fonction mesurable comme lim sup de fonctions mesurables et dont on va voir qu'elle est
essentiellement bornée. Donc, par l'hypothèse d'avoir une suite de Cauchy, pour n > 0, ϵ = 1/n il
1
existe Nn tel que ∀p, q ≥ Nn , ||fp − fq ||∞ ≤ . Par dénition de la norme, on peut donc xer An,p,q
n
c
(pour p, q ≥ Nn ) avec µ(An,p,q ) = 0 tel que
1
sup |fp (ω) − fq (ω)| ≤ .
ω∈An,p,q n
On va intersecter tous ces ensembles (une intersection dénombrable) pour avoir µ-p.p. une suite
∩p,q≥Nn An,p,q . On a µ(Ac ) ≤ n>0 p,q≥Nn µ(Acn,p,q ) = 0 (vu
P P
de Cauchy. On prend donc A = ∩n>0
c
que A est une union dénombrable).
c
De plus pour ω ∈ A , on a
1
∀n, ∀p, q ≥ Nn , |fp (ω) − fq (ω)| ≤
n
donc (fn (ω)) est de Cauchy dans IK donc converge. Sa limite est forcément f (ω) et en passant à la
limite q → ∞ ci dessus, pour tout ω ∈ A :
1
∀n, ∀p ≥ Nn , |fp (ω) − f (ω)| ≤ .
n
Comme µ(Ac ) = 0 on déduit
1
∀n, ∀p ≥ Nn , ||fp − f ||∞ ≤ .
n
Ceci implique ||f ||∞ ≤ ||fp ||∞ +||fp −f ||∞ donc f est dans L∞ (Ω, T , µ; IK) et la convergence de fn vers
f dans cet espace. Comme toute suite de Cauchy converge, on a obtenu la complétude voulue.
2 Dénitions et propriétés élémentaires des espaces Lp(Ω, µ)

On dénit les espaces :
Z
p
L (Ω, T , µ; IK) = {f : Ω → IK mesurable | |f |p dµ < ∞},
pour p ∈ [1, ∞[. Alors

Z
||f ||p = ( dµ|f |p )1/p .
81
n'est pas une norme (mais une seminorme sur Lp (Ω, T , µ) car si ||f ||p = 0 alors f est seulement nulle
presque partout. On considère donc l'espace des classes d'équivalences à égalité presque partout près
de fonctions f˙ et l'espace de Lebesgue :
Dénition 6.2.
Z
L (Ω, T , µ; IK) = {f˙; f : Ω → IK
p
mesurable et |f |p dµ < ∞},
pour p ∈ [1, ∞[.

Comme pour le cas p = ∞, on on note aussi plus brièvement
Lp (Ω; IK) = Lp (Ω, µ; IK) = Lp (Ω, T , µ; IK)

et Lp (Ω) = Lp (Ω; IR), si il n'y a pas de confusion possible.
Par la suite, on identie f à f˙ dans ce contexte, on répète que les égalités sont des
égalités µ − p.p..
Montrons que ||.||p est une norme sur Lp (Ω, T , µ). La séparation et l'homogénéité sont maintenant
évidentes. On rappelle l'inégalité de Hölder d'abord dans le cas le plus simple
Proposition 6.3. Si f , g sont mesurables, ∥f ∥ < +∞ et ∥g∥ < +∞ , alors f g ∈ L (Ω, T , µ; IK)
p
et ∥f g∥ ≤ ∥f ∥ ∥g∥ .
p ∞
p p ∞
Démonstration. µ
Il sut de noter que, -presque partout, on a |g(x)| ≤ ∥g∥∞ , et donc |f (x)g(x)|p ≤
|f (x)|p ∥g∥p∞ . En intégrant cette inégalité, on obtient bien
Z Z
∥f g∥pp = p
|f (x)g(x)| dµ ≤ |f (x)|p ∥g∥p∞ dµ = ∥f ∥pp ∥g∥p∞ .
Ω Ω
La version générale est la suivante
Lemme 6.4 (inégalité de Hölder). Si p, q ∈ [1, ∞[ tels que 1/p+1/q = 1/r ≤ 1, f ∈ Lp (Ω, T , µ; IK), g ∈
Lq (Ω, T , µ; IK) alors f g ∈ L (Ω, T , µ; IK) et
r
||f g||r ≤ ||f ||p ||g||q .

Démonstration. f, g par |f |r , |g|r on se ramène au cas r = 1.
En remplaçant
Par hypothèse dans le cas r = 1, 1 < p < ∞, on remarque que par concavité du logarithme, on a
p q p q
pour a, b > 0 log (a /p + b /q) ≥ log (a ) /p + log (b ) /q = log (ab).
Donc on obtient en exponentiant (et en vériant directement les cas d'annulations), l'inégalité
d'Young :
|f (x)|p |g(x)|q
|f (x)g(x)| ≤ + .
p q
Donc en intégrant, on obtient f g ∈ L1 et appliquant à λf , λ > 0 :
λp−1 λ−1
||f g||1 ≤ ||f ||pp + ||g||qq .
p q
Comme le cas d'annulation ||f ||p = 0 ou ||g||q = 0 sont évidents (car alors f g = 0 µ − p.p.),
on conclut en supposant ||f ||p ̸= 0, ||g||q ̸= 0 et en prenant la valeur de λ donnant le minimum
q/p
λ = ||f ||−1
p ||g||q .
82
Une conséquence importante est l'exercice suivant :
Exercice . 6.2 Si µ est une mesure nie pour 1 ≤ p ≤ q ≤ ∞, montrer que :
L∞ (Ω, T , µ; IK) ⊂ Lq (Ω, T , µ; IK) ⊂ Lp (Ω, T , µ; IK) ⊂ L1 (Ω, T , µ; IK).
On en déduit l'inégalité triangulaire :
Théorème 6.5 . Soient p ∈ [1, +∞] et f, g ∈ L (Ω). Alors f + g ∈ L (Ω)

p p
et ∥f + g∥ ≤ ∥f ∥ .
(Inégalité de Minkowski)
p p + ∥g∥p
Démonstration. p = +∞, et le cas p = 1 est simplement l'inégalité triangulaire

On a déjà traité le cas
p
habituelle. Supposons donc p ∈]1, +∞[ et f, g ∈ L (Ω).
p
Commençons par montrer que ∥f + g∥p < +∞. Comme x 7→ x est convexe et croissante, on a
pour tout x que
p p
1 1 1 1 1 1
f (x) + g(x) ≤ f (x) + g(x) ≤ |f (x)|p + |g(x)|p .
2 2 2 2 2 2
En intégrant cette inégalité, on obtient que
1 1
p
∥f + g∥pp ≤ (∥f ∥pp + ∥g∥pp )) .
2 2
Ceci nous prouve que ∥f + g∥p < +∞.
p
Maintenant, notons q = l'exposant conjugué de p. Ci-dessous, on va utiliser l'inégalité de
p−1
Hölder, et le fait que
Z 1q Z 1− p1
p−1 (p−1)q p
|f + g| q
= |f + g| dµ = |f + g| = ∥f + g∥p−1
p .
Ω Ω
Alors on a
Z
∥f + g∥pp = |f + g|p dµ
ZΩ
≤ (|f | + |g|)|f + g|p−1 dµ
ZΩ Z
= |f ||f + g| dµ + |g||f + g|p−1 dµ
p−1
Ω Ω
p−1
≤ ∥f ∥p |f + g| q
+ ∥g∥p |f + g|p−1 q
p−1
= (∥f ∥p + ∥g∥p ) |f + g| q
= (∥f ∥p + ∥g∥p )∥f + g∥pp−1
Si jamais ∥f + g∥p = 0 on n'a rien à démontrer ; sinon, en divisant des deux côtés par ∥f + g∥p−1
p on
obtient nalement ∥f + g∥p ≤ ∥f ∥p + ∥g∥p .
Exercice . 6.3 Soit (Ω, T , µ) un espace mesure σ -ni. Soit f ≥ 0 une fonction mesurable positive,
alors pour p ∈]0, ∞[ Z Z ∞
p
f dµ = dtptp−1 µ({ω : f (ω) > t}).
0
83
On rappelle d'abord la version Lp du théorème de convergence dominée.
Théorème 6.6 Soit p ∈ [1, +∞[. Soit (Ω, µ) un espace

Lp ).
mesuré, et f une suite de fonctions mesurables convergeant µ-presque partout vers f , et vériant la
(Théorème de convergence dominée
domination |f | ≤ g avec g ∈ L (Ω, µ). Alors, f , f ∈ L (Ω, µ) et f converge vers f dans L (Ω, µ),
n
p p p
c'est à dire.
n n n
lim ||fn − f ||p = 0.

n→∞
Démonstration. On a |fn − f |p → 0 µ-presque partout. De |fn | ≤ g on déduit

p
que fn , inLp (Ω, µ; IK)
en passant à la limite on obtient |f | ≤ g et donc f ∈ L (Ω, µ; IK). De plus, on a la domination :
|fn − f |p ≤ (|fn | + |f |)p ≤ (2g)p = 2p g p
et comme g ∈ Lp (Ω, µ) et positive, on déduit que g p = |g|p est µ-intégrable et sert donc de domination
pour appliquer le théorème de convergence dominée usuelle qui donne le résultat :
Z Z
||fn − f ||pp = p
|fn − f | dµ →n→∞ 0dµ = 0.
Ω Ω
Théorème 6.7 . Soit (Ω, µ) un espace mesuré, les espaces L (Ω, µ, IK) pour p ∈p
sont des espaces de Banach.

(de Riesz-Fischer)
[1, ∞]
Démonstration. On vient de voir que Lp (Ω, µ, IK) est un espace vectoriel normé, et même la complé-
tude dans le cas p = ∞.
Il reste le cas p < ∞. En décomposant en partie réelle et imaginaire, on peut supposer et donc
on suppose IK = IR.
P
Pour la complétude, on utilise la proposition 2.6. Soit
Pk un qui P est absolument convergente, il
p
faut montrer qu'elle converge dans L . Soit gk = n=1 |un |, ||gkP
||p ≤ ||un ||p et |gk |p est croissante,
donc par convergence monotone converge vers g avec ||g||p ≤
P p P ||un ||p . Donc |g|p ∈ L1 qui donne
une domination pour | un | et un est p.p. absolument convergente, donc a p.p. une limite et par
p
convergence dominée, converge donc dans L . .
2.1 Résultats de convergences

En suivant le même raisonnement on obtient le résultat suivant :
Théorème 6.8. Soient (Ω, T , µ) un espace mesuré, p ∈ [1, +∞[, et (f ) une suite d'éléments de
L (Ω) qui converge vers f dans (L (Ω), ∥ · ∥ ). Alors il existe une suite extraite (f ) telle que (f )
n
p p
tend vers f , µ-presque partout et dans L (Ω).

p nk nk
p
Démonstration. p
(f )
On extrait nk ||f − f || ≤ 1/2 .
telle que nk+1 nk p
k
k
(c'est possible car la suite est de
Cauchy dans donc on prend nk telle que ||fq − fnk ||p ≤ 1/2 pour q ≥ nk .)
L Pn
Donc on pose gn = k=1 |fnk+1 − fnk | qui est une suite croissante avec
X ∞
X
||gk ||p ≤ ||fnk+1 − fnk ||p ≤ 1/2k = 1.
k k=1
On déduit donc en appliquant le théorème de convergence monotone que gk a une limite g =

P∞
k=1 |fnk+1 − fnk | telle que ||g||p ≤ 1. On l'utilise maintenant comme condition de domination.
84
c
P
Donc k (fnk+1 − fnk ) est absolument convergente sur A = {ω : g(ω) < ∞} et on a µ(A ) = 0,
vu ||g||p < ∞. Donc par série télescopique (fnk (ω)) converge pour ω ∈ A. (et comme suite extraite
p p
elle converge aussi dans L mais en fait elle est dominée par |fn0 | + g ∈ L et converge aussi par
convergence dominée).
Proposition 6.9. Soient (Ω, T , µ) un espace de probabilité et f : Ω → [0, +∞] une fonction mesu-
rable. Alors on a
∥f ∥∞ = lim ∥f ∥p .
p→+∞
Démonstration. Commençons par remarquer que l'on a toujours
Z p1
1
p
∥f ∥p = |f | dµ ≤ (∥f ∥p∞ µ(Ω)) p = ∥f ∥∞ .
Ω
Par conséquent, si ∥f ∥p → +∞ quand p → +∞ alors ∥f ∥∞ = +∞. Pour voir la réciproque,

notons que pour t < ∥f ∥∞ xé, l'ensemble At = {x ∈ Ω : |f (x)| > t} est de mesure strictement
positive, par conséquent
1 1
∥f ∥p ≥ (tp µ(At )) p = tµ(At ) p → t quand p → +∞ .
Ceci montre que si ∥f ∥∞ = +∞ alors ∥f ∥p tend vers +∞ ; mais aussi que, si ∥f ∥∞ < +∞ on a pour
tout ε>0 que pour p susamment grand ∥f ∥∞ − ε ≤ ∥f ∥p ≤ ∥f ∥∞ .
2.2 Résultats de densité

On rappelle le résultat suivant qui se déduit de la construction de l'intégrale (cf. lemme 4.21)
Lemme 6.10. Soit (Ω, µ, T ) un espace σ-ni. L'ensemble S des fonctions étagées intégrables est
dense dans tous les L (Ω, µ, T ), 1 ≤ p < ∞. En particulier, L (Ω, µ, T ) ∩ L (Ω, µ, T ) est dense dans
p 1 ∞
L (Ω, µ, T ) pour 1 ≤ p < ∞.

p
Lemme 6.11. Soit (Ω, µ, T ) un espace σ-ni avec T = σ(E) pour E une famille stable par inter-
section nie et de mesure nie pour µ, et contenant une suite A avec µ(A ) < ∞ et Ω = ∪ A .
Alors l'espace vectoriel E = V ect{1 , A ∈ E} est dense dans tous les L (Ω, µ, T ), 1 ≤ p < ∞. En
n n n n
p
particulier, si E est dénombrable, alors L (Ω, µ, T ), 1 ≤ p < ∞ est séparable.

A
p
En général L∞ (Ω, µ, T ) n'est PAS séparable, sauf si Ω est un ensemble ni, par exemple ℓ∞ (IN)
n'est pas séparable (c'est un exercice plus dur de niveau M1).
Démonstration. An ∈ E avec µ(An ) < ∞ et Ω = ∪n An .

Soit
Lp
Soit M := {A ∈ T : ∀n, 1A∩An ∈ E }. Clairement E ⊂ M. On va montrer que M est une classe
monotone :
Ω ∈ M car 1An ∈ E
Si A ⊂ B et A, B ∈ M, on a 1(B\A)∩An = 1B∩An − 1A∩An par le TD 1 donc dans l'espace
Lp
vectoriel E .
Si Bm ∈ M suite croissante d'union B alors 1Bm ∩An → 1B∩An partout par le TD 1, Or on
p
a domination par 1An ∈ L (Ω, µ, T ) donc par convergence dominée 1Bm ∩An → 1B∩An dans
Lp
Lp (Ω, µ, T ) et donc 1B∩An ∈ E
85
Le lemme de classe monotone implique M ⊃ T (E). Donc si B ∈ T (E) est de mesure nie, on a
Lp
1B∩An ∈ E et par la même application du théorème de convergence dominée (par 1B cette fois) on
Lp Lp
déduit 1B ∈ E . Donc E contient toute fonction étagée intégrable et le résultat précédent conclut.
La séparabilité vient de la densité de l'ensemble dénombrable V ectQ
l
(1A , A ∈ E).
n
Le support d'une fonction continue f est le fermé supp(f ) = f −1 ({0})c .
Un fonction sur IR est
0
donc à support compact quand elle est nulle en dehors d'un ensemble borné. On note Cc (Ω) est
l'ensemble des fonctions à support compact sur un ouvert Ω.
Théorème 6.12. Soit Ω ⊂ IR un ouvert et λ la mesure de Lebesgue sur la tribu borélienne B(Ω) =
n
B(IR ) (tribu induite sur Ω). Alors l'ensemble des fonctions continues à support compact C (Ω) est
n 0
dense dans L (Ω, B(Ω), λ) pour 1 ≤ p < ∞, qui est séparable.

Ω c
p
Démonstration. E = {A =
Par le lemme précédent avec
Q n
[a , b ], a ≤ b }
i=1 i i i i l'ensemble des pavés,
il sut de voir que les 1A sont approchés par des fonctions continues à support compact pour
A = ni=1 [ai , bi ]. Par produit de fonctions (de variables diérentes), cela se ramène au cas n = 1. Soit
Q
f = 1[a,b] et fn (t) = 1 si t ∈ [a, b], fn (t) = 1 − max(n(t − b), 1) si t > b, fn (t) = 1 − max(n(a − t), 1)
0
si t < a. Alors il est facile de voir que (fn )n≥1 est une suite dans Cc (Ω) qui converge ponctuellement
p
vers f (exo). Elle est dominée par 1[a−1,b+1] qui est dans L (Ω, B(Ω), λ) pour 1 ≤ p < ∞ donc par
convergence dominée, ||fn − f ||p → 0. Donc on peut appliquer le lemme précédent et conclure.
3 Cas discret : espaces ℓp(I), p ∈ [1, ∞[ (cf. TD)

Dénition 6.3. Une famille (ai )i∈I de nombres réels positifs est dite sommable si
( )
X
sup aj : J ⊂ I, fini <∞
j∈J
et alors on note ( )
X X
ai = sup aj : J ⊂ I, fini .
i∈I j∈J
Tout d'abord, le résultat simple suivant ramène au cas I dénombrable, ce que l'on supposera
souvent par la suite :
Exercice . 6.4 Si (ai )i∈I est une famille sommable, alors le support I0 = {i ∈ I : ai ̸= 0} est au plus
dénombrable.
Dénition 6.4. Soit p ∈ [1, ∞[. Une famille (zi )i∈I de nombres complexes ou réels est dite de p-
sommable si la famille (|zi |p )i∈I est sommable. On note ℓp (I, IK) l'ensemble des familles d'éléments
de IK p-sommable.
Un examen de la dénition indique que ℓp (I, IK) = Lp (I, P(I), ν) avec ν la mesure de comptage,
c'est donc un espace de Banach. On a aussi par dénition (dans le cas positif puis le cas quelconque) :
X Z
ai = adν.
i∈I I
86
On note
!1/p
X
||z||p = |zi |p .
i∈I
L'inégalité de Hölder s'écrit donc pour x ∈ ℓq (I), y ∈ ℓp (I) : avec 1/p + 1/q = 1, p, q ∈]1, ∞[ :
!1/q !1/p
X X X
xi yi ≤ |xi |q |yi |p
i∈I i∈I i∈I
Théorème 6.13. (de sommation par paquets, cas positif) Soit (Iλ )λ∈Λ une partition de I . Une famille
est sommable si et seulement si on a à la fois les deux propriétés suivantes :
(ai )i∈I
1. pour chaque λ ∈ Λ, (a ) est sommable, disons de somme σ
i i∈Iλ λ
λ λ∈Λ
!
X X X X
ai = σλ ≡ ai .
Démonstration. Vu l'union disjointe on écrit
X
1I = 1Iλ .
λ∈Λ
Par le cas positif de l'interversion série intégrale (aussi conséquence du Théorème de Fubini-Tonelli),
on a égalité dans [0, +∞] :
Z Z X !
X XZ XZ X X
ai = adν = 1Iλ adν = 1Iλ adν = adν = ai .
i∈I I I λ∈Λ λ∈Λ I λ∈Λ Iλ λ∈Λ i∈Iλ
Maintenant, la sommabilité correspond à la nitude des sommes rencontrées, ce qui donne l'équiva-
lence.
Corollaire 6.14. Soit (a ) une famille de nombres positifs, alors la formule, pour A ⊂ I :
i i∈I
X
µ(A) = ai ,
i∈A
dénit une mesure (positive) sur (I, P(I))

Démonstration. Par dénition une somme vide est 0 donc µ(∅) = 0 pour la σ -additivité, si A =
∪λ∈Λ Aλ est une union disjointe (dénombrable ou non) alors le théorème de sommation par paquet
donne : X XX X
µ(A) = ai = ai = µ(Aλ ),
i∈A λ∈Λ i∈Aλ λ∈Λ
ce qui implique la σ -additivité voulue.
87
Chapitre 7
Espaces de Hilbert ; bases hilbertiennes
1 Généralités
Soit H un espace vectoriel sur IK = IR ou C
l
Dénition 7.1. Un produit scalaire sur H est une application
⟨., .⟩ : H × H → IK
telle que :
1. pour tout y ∈ H , ⟨y, .⟩ : H → IK est linéaire
2. - Si IK = IR ∀x, y ∈ H, ⟨x, y⟩ = ⟨y, x⟩ (symétrie)

- Si IK = Cl ∀x, y ∈ H, ⟨x, y⟩ = ⟨y, x⟩ (symétrie hermitienne)
3. pour x∈H , ⟨x, x⟩ ∈ IR+

4. pour x∈H , ⟨x, x⟩ = 0 si et seulement si x = 0.
Un espace H avec un tel produit scalaire est un espace préhilbertien réel (si IK = IR) et complexe (si
IK = C).
l
On remarque que dans le cas complexe, ⟨., y⟩ est antilinéaire, c'est-à-dire avec λ le conjugué
complexe,
l , ⟨λx + z, y⟩ = λ⟨x, y⟩ + ⟨z, y⟩.
∀x, y, z ∈ H, λ ∈ C
Exemple . 7.1 Sur H = ℓ2 (IN, C 2
l ) := L (IN, ν; C
l) (espace L2 avec la mesure de comptage ν) on a le
produit scalaire (hermitien canonique) :
X
⟨x, y⟩ = xi y i
i∈I
Dans le cas réel, la même formule sans conjugaison complexe fonctionne.
Exemple . 7.2 Sur H = L2 (Ω, µ; C

l) avec (Ω, µ) un espace mesuré σ -ni, on a le produit scalaire
(hermitien canonique) :
Z
⟨f, g⟩ = f (x)g(x)dµ(x).
Ω
88
Exemple . 7.3 Sur H = C 0 ([a, b], C
l) on a le produit scalaire :
Z b
⟨f, g⟩ = f (x)g(x)dx).
a
Proposition 7.1. Si H est muni d'un produit scalaire on a l'inégalité de Cauchy-Schwarz :

|⟨x, y⟩|2 ≤ ⟨x, x⟩⟨y, y⟩
avec égalité si et seulement si x, y sont liés. De plus ||x|| = p⟨x, x⟩ est une norme sur H vériant
l'identité du parallélogramme :
2 2
x+y x−y 1
+ = (||x||2 + ||y||2 ).
2 2 2
Démonstration. On a
⟨x + ty, x + ty⟩ = ||x||2 + t2 ||y||2 + 2t Re(⟨x, y⟩) ≥ 0
c'est un polynôme de degré 2 qui est toujours positif ou nul, donc son discriminant ∆ = 4 Re(⟨x, y⟩)2 −
⟨x,y⟩
4||x||2 ||y||2 ≤ 0. En remplaçant y par uy avec u= |⟨x,y⟩|
si ⟨x, y⟩ =
̸ 0 on obtient
Re(⟨x, y⟩u) = |⟨x, y⟩| ≤ ||x||2 ⟨uy, uy⟩ = ||x||2 ||y||2 uu = ||x||2 ||y||2 .
Le même calcul donne pour u de module 1 la norme de
∥ ||y||x − u||x||y ∥2 = 2||y||2 ||x||2 − 2||x||||y|| Re(⟨x, uy⟩)
qui vaut 0 si on choisit u tel que ⟨x, y⟩u = |⟨x, y⟩| et que l'on est dans le cas d'égalité de C-S, ce qui
donne la relation de dépendance linéaire cherchée ||y||x − u||x||y = 0. (La réciproque, c'est à dire
l'égalité en cas de dépendance linéaire, est évidente).
Pour vérier que l'on a une norme, la positivité vient de l'axiome 3, la séparation vient du dernier
axiome, l'homogénéité vient de
⟨λy, λy⟩ = λλ⟨y, y⟩ = |λ|2 ⟨y, y⟩
et l'inégalité triangulaire vient d'une application de C-S :
⟨x + y, x + y⟩ = ||x||2 + ||y||2 + 2 Re⟨x, y⟩ ≤ ||x||2 + ||y||2 + 2||x||||y|| = (||x|| + ||y||)2 .
Enn, on a aussi la relation :
⟨x − y, x − y⟩ = ||x||2 + ||y||2 − 2 Re⟨x, y⟩
soit en faisant la somme (avec l'égalité débutant le calcul pour l'inégalité triangulaire), on obtient
l'identité du parallélogramme.
Remarque . 7.1 L'identité du parallélogramme implique que

x+y 2
2
≥ 21 (||x||2 + ||y||2 ) avec égalité si
et seulement si x=y ce qui donne un résultat de convexité (en faite stricte car l'inégalité est stricte
si x ̸= y ). (On a vu en TD que par continuité la convexité à mi point implique la convexité).
89
Une autre identité importante s'établit en prenant la diérence des égalités donnant la preuve de
l'identité du parallélogramme ci-dessus, c'est l'identité de polarisation :
||x + y||2 − ||x − y||2

Re⟨x, y⟩ =
4
On retrouve aussi
||x + iy||2 − ||x − iy||2
Im⟨y, x⟩ = Re⟨iy, x⟩ =
4
d'où la formule de polarisation complexe :
||x + y||2 − ||x − y||2 + i||x + iy||2 − i||x − iy||2

⟨y, x⟩ =
4
ou encore en bref
3
1X k
⟨y, x⟩ = i ||x + ik y||2 (7.1)
4 i=0
Dénition 7.2. Un espace pré-hilbertien complet est appelé espace de Hilbert.
Théorème 7.2. Soit (Ω, T , µ) un espace mesuré. Alors H = L (Ω, T , µ; IK) est un espace de Hilbert
2
sur IK avec le produit scalaire déni pour f, g ∈ H par :

Z
⟨f, g⟩ = f gdµ.
Ω
Démonstration. 1
On ne traite que le cas IK = C.
l Si f, g ∈ H , l'inégalité de Hölder avec p=q =2
donne f g ∈ L (Ω, T , µ; IK) et donc l'intégrale dénissant le produit scalaire est bien dénie. On
vérie les axiomes des produits scalaires : 1/ ⟨f, g⟩ est linéaire en la deuxième variable g par linéarité
de l'intégrale.
2/ la symétrie hermitienne vient du calcul suivant :
Z Z Z
⟨f, g⟩ = f gdµ = f gdµ = f gdµ = ⟨g, f ⟩.
Ω Ω Ω
3/
Z
⟨f, f ⟩ = |f |2 dµ = ||f ||22 ∈ [0, +∞[
Ω
4/ Comme on sait déjà que ||.||2

la séparation de la norme implique que si ||f ||2 =0 alors f =0
2
(µ-presque partout c'est à dire) dans H = L (Ω, T , µ; IK).
On a donc bien un espace pré-hilbertien, et le Théorème de Riesz-Fischer 6.7 dit que L2 (Ω, T , µ; IK)
est complet, donc un espace de Hilbert.
Exemple . ℓ (
0
7.4
2
IN; C
l ) sont des espaces de Hilbert (cf. chapitre 6 pour la complétude), mais pas
C ([a, b], C
l) dont la complétion est l'espace de Hilbert L2 ([a, b], λ; C
l ). La complétion d'un espace
préhilbertien en tant qu'e.v.n. (cf. annexe A section 3) est toujours un espace de Hilbert.
90
2 Projection sur un convexe fermé
On va généraliser l'existence de projection orthogonale sur un sous-espace d'un espace euclidien
d'abord au cas des convexes fermés et en dimension innie.
Théorème 7.3. Soit H un espace de Hilbert et C ⊂ H un convexe fermé non-vide. Pour tout f ∈ H
il existe un unique u = P (f ) ∈ C tel que
C
||f − u|| = inf ||f − v||.

v∈C
De plus c'est l'unique vecteur u ∈ C vériant la propriété caractéristique :

∀v ∈ C, Re(⟨f − u, v − u⟩) ≤ 0
Enn, P est une application 1-lipschitzienne appelée

C projection sur C .
Remarque . 7.2 Un théorème de projection similaire sur un convexe fermé est valide dans Lp (Ω, T , µ)
pour tout 1 < p < ∞ (et pas seulement p = 2), mais il n'y a pas de caractérisation aussi simple de
la projection PC (en l'absence de produit scalaire) et la projection PC est seulement uniformément
continue (et plus nécessairement Lipschitz). Mais ce résultat est beaucoup plus dur (un exercice
dicile de M1 Math).
Démonstration. On fait une preuve directe, utilisant l'identité du parallélogramme.

Soit vn ∈ C tel que ||f − vn || → d = inf v∈C ||f − v||
En appliquant l'identité à a = f − vn , b = f − vm , on trouve :
2 2
vn + vm vn − vm 1
f− + = (||f − vn ||2 + ||f − vm ||2 ) → d2 .
2 2 2
vn +vm vn +vm 2
Or par convexité
2
∈C donc f− 2
≥ d2 donc
2
vn − vm 1
≤ (||f − vn ||2 + ||f − vm ||2 ) − d2 → 0.
2 2
On déduit donc que vn est de Cauchy, donc converge vers u et par continuité de la norme d=
||f − u||.
2
Soit g : v 7→ ||f − v||2 . On peut calculer la diérentielle dg(u) = Re(⟨f − u, .⟩). Or si g atteint
son minimum en u, pour v ∈ C , t ∈ [0, 1],
||f − tv − (1 − t)u||22 = ||f − u||22 + t2 ||v − u||22 − 2t Re(⟨f − u, v − u⟩) ≥ ||f − u||22
donc2 Re(⟨f − u, t − u⟩) ≤ t||v − u||22 et la limite t → 0 donne l'inégalité caractéristique. Récipro-
quement, on a en t = 1, l'inégalité qui conclut :
||f − u||22 − ||f − v||22 = 2 Re(⟨f − u, v − u⟩) − ||v − u||22 ≤ 0.
Pour voir l'unicité, si u1 , u2 ∈ C , on peut utiliser la convexité stricte sous la forme de l'identité
du parallélogramme, on a
2 2
u1 + u2 u1 − u2 1
f− + = (||f − u1 ||2 + ||f − u2 ||2 ) = d2
2 2 2
91
u1 +u2 2 2
soit comme f− 2
≥ d2 on déduit u1 −u
2
2
≤ 0 donc u1 = u2 .
Par l'unicité, PC est bien dénie et il ne reste qu'à voir la lipschitizianité. En appliquant la
propriété caractéristique pour f1 , f2 :
Re(⟨f1 − PC (f1 ), PC (f2 ) − PC (f1 )⟩) ≤ 0,

Re(⟨f2 − PC (f2 ), PC (f1 ) − PC (f2 )⟩) ≤ 0,
soit en additionnant :
Re(⟨f1 − f2 + PC (f2 ) − PC (f1 ), PC (f2 ) − PC (f1 )⟩) ≤ 0
soit en utilisant Cauchy-Schwarz :
||PC (f2 ) − PC (f1 )||2 ≤ Re(⟨f1 − f2 , PC (f2 ) − PC (f1 )⟩) ≤ ||f1 − f2 || ||PC (f2 ) − PC (f1 )||.
Théorème 7.4. Soit H un espace de Hilbert et K ⊂ H un sous espace vectoriel fermé. Pour tout
f ∈ H , il existe un unique u = P (f ) ∈ K tel que
K
||f − u||2 = inf ||f − g||2 .

v∈K
De plus c'est l'unique vecteur u ∈ K tel que

∀v ∈ K, ⟨v, f − u⟩ = 0
Enn, P est une application linéaire bornée appelée

K projection orthogonale sur K .
Démonstration. Il reste à voir la nouvelle caractérisation équivalente car celle-ci étant une relation
PK (λPK (f ) + PK (g) vérie la relation pour λf + g et doit
linéaire, elle impose la linéarité de
donc être par unicité PK (λf + g)). La nouvelle caractérisation est plus forte. Réciproquement, si
Re(⟨f −u, v−u⟩) ≤ 0, en prenant v = 2u et v = 0, on trouve Re(⟨f −u, u⟩) = 0 donc Re(⟨f −u, v⟩) ≤ 0
pour tout v dans K donc aussi pour −v par linéarité d'où l'égalité à 0.
Exemple . 7.5 Si H = L2 (Ω, µ, IR)

C = {f ≥ 0 p.p.}.
Alors PC (f ) = f 1{f ≥0} . (exo) Trouver aussi de même la projection sur l'ensemble de f : Ω → [0, 1].
3 Applications : Orthogonalité et Dualité

3.1 Orthogonalité
On peut dénir dans un espace de Hilbert une notion d'orthogonal comme en dimension nie.
Dénition 7.3. Si F ⊂H est un sous-espace, alors l'orthogonal de F est
F ⊥ = {x ∈ H, ∀y ∈ F, ⟨x, y⟩ = 0}
92
On dit que x est orthogonal à F x ∈ F ⊥ . On remarque que
si
\
F⊥ = (⟨y, ·⟩)−1 ({0})
y∈F
est toujours un sous-espace fermé comme intersection de sous-espaces fermé, comme image inverse
d'un sous-espace fermé par une application linéaire continue (le produit scalaire). La proposition
suivante décrit la décomposition en somme directe orthogonale. Tout se passe comme en dimension
nie pour les sous-espaces fermés, et sinon, il faut ajouter une adhérence.
Proposition 7.5. Si F est un sous-espace de l'espace de Hilbert H alors F ⊥⊥

= F, et on a la somme
directe orthogonale ⊥
H =F ⊕F
et alors p et p = 1 − p sont les projections associées à cette décomposition.
F F⊥ F
Ici F ⊥⊥ = (F ⊥ )⊥ est l'orthogonal de l'orthogonal.
Démonstration. ⊥
1. On remarque d'abord que F ⊂ F ⊥⊥ .
En eet par dénition de F
⊥
⊥
si x ∈
F, y ∈ F , ⟨x, y⟩ = 0 et donc comme c'est pour tout y ∈ F la dénition du biorthogonal
⊥⊥
donne x ∈ F .
2. On remarque ensuite que F ⊥⊥ ∩ F ⊥ = {0}. En eet, si x ∈ F ⊥⊥ ∩ F ⊥ alors ⟨x, x⟩ = 0 donc
x=0 (par l'axiome de séparation).
3. Montrons ensuite que pF ⊥ = 1 − pF (les projections sont bien dénies car on a des sous-
espaces fermés l'espace de Hilbert H donc on peut utiliser le théorème de projection). En
eet, si y ∈ H la relation caractéristique de la projection othogonale dit que y − pF (y) est
orthogonal à F donc dans F ⊥ et comme y − (y − pF (y)) = pF (y) est orthogonal à F ⊥ , on doit
avoir y − pF (y) = pF ⊥ (y) par caractérisation de la projection.
4. On en déduit la somme H = F + F⊥ (par l'inclusion du 1 et l'intersection du 2, on sait que
cette somme doit être directe). Le point précédent donne la relation
y = pF ⊥ (y) + pF (y)
ce qui montre que tout vecteur H se décompose comme somme d'un vecteur de F et d'un
vecteur deF ⊥ . L'énoncé sur les projections associées à la décomposition est évident à partir
de là.
⊥⊥
5. Il reste à voir que F ⊂ F ce qui donne l'égalité avec le point 1. Mais si y ∈ F ⊥⊥ , y −PF (y) ∈
F ⊥⊥ par 1 et le fait fait que F ⊥⊥ est un sous-espace vectoriel. Mais on vient de voir au 3 que
y − PF (y) = pF ⊥ (y) ∈ F ⊥ . Donc y − PF (y) ∈ F ⊥⊥ ∩ F ⊥ = {0} par le 2. donc y = PF (y) ∈ F ,
ce qui conclut.
3.2 Dualité : le théorème de représentation de Riesz

On en déduit maintenant le calcul du dual de H (voir sous-section 9 pour des rappels).
Théorème 7.6 . Soit ϕ une forme linéaire continue sur un

espace de Hilbert H alors il existe un unique f ∈ H tel que
(théorème de représentation de Riesz)
∀v ∈ H, ϕ(v) = ⟨f, v⟩.
93
De plus, on a l'expression duale pour la norme :
||f || = sup |⟨f, v⟩|.
||v||≤1
Remarque . ′
7.3 f 7→ ⟨f, .⟩ est une isométrie antilinéaire identiant
(facultative) Dans le cas complexe,
H et H (et donc identiant linéairement H' au conjugué H ayant la même structure normique et de
groupe mais λ.v = λv si v 7→ v est la bijection/identité de H → H notée . pour le caractère suggestif
′
de la relation à la conjugaison complexe). Dans la cas complexe on a donc H ≃ H et dans le cas
′
réel H ≃ H.
Démonstration. K = ϕ−1 ({0}) le noyau de ϕ. Si K = H alors f = 0 convient. On suppose donc

Soit
−PK (g0 )
̸ K et g = ||gg00−P
K ̸= H . Soit donc g0 ∈ K (g0 )||2
un vecteur de norme 1 et orthogonal à K . Comme ϕ est
2
une forme linéaire, on s'attend à ce que K et g engendrent L , sorte de généralisation du théorème
ϕ(v)
du rang (on va voir cela plus loin en utilisant l'orthogonalité). En eet, soit v ∈ H , w = v − g
ϕ(g)
ϕ(v) ϕ(v)
vérie ϕ(w) = ϕ(v) − ϕ(g)
ϕ(g) =0 donc w ∈ K = Kerϕ et v = λg + w avec λ= ϕ(g)
.
On montre donc que f = ϕ(g)g convient, en montrant l'égalité sur un v quelconque en utilisant
la forme précédente :
⟨f, v⟩ = ϕ(g)⟨g, v⟩ = ϕ(g)⟨g, λg + w⟩ = ϕ(g)λ||g||22 = ϕ(g)λ = ϕ(v).

L'égalité des normes vient de Cauchy Schwarz qui implique que ≥ avec égalité en prenant v = f /||f ||
si f ̸= 0.
Remarque . 7.4 (facultative) Il n'est parfois pas judicieux d'identier un espace de Hilbert à son
dual, notamment quand plusieurs espaces de Hilbert sont considérés et que les identications sont
2
n2 |un |2 < ∞}
P
incompatibles à des relations de sous-espaces. Soit H = ℓ (IN) et K = {u ∈ H,
n∈IN
1
|u |2 < ∞}. Il est facile de voir
P
Si on considère l'ensemble des suites telles que L = {(un )
n∈IN n2 n
′ ′
que K ⊂ H ⊂ L et que La transposé de l'inclusion K ⊂ H s'identie à H ≃ H ⊂ K ≃ L. Il vaut
′
alors mieux identier K à L (et pas K ) en ayant une identication compatible avec les inclusions
avec H.
4 Bases Hilbertiennes
Dénition 7.4. Soit H un espace préhilbertien. Une famille (xi )i∈I est dite orthogonale si pour tout
i ̸= j , ⟨xi , xj ⟩ = 0.
Si de plus ||xi || = 1, orthonormale
base hilbertienne
elle est dite .
Une (ou base orthonormale) de H est une famille orthonormale (ei )i∈I telle que
V ect(ei , i ∈ I) est dense dans H.
Exemple . e 7.6 i la suite dont la seule coordonnée non-nulle est la i-ème égale à 1 donne une base
hilbertienne de ℓ2 (I). (par construction de ℓ2 (I)) Les bases hilbertiennes vont permettre d'identier
tout espace de Hilbert à cet exemple.
4.1 Procédé d'orthonormalisation de Gram-Schmidt

1
Notons tout d'abord que la projection d'un point sur un sous-espace vectoriel de dimension nie
se calcule facilement à l'aide d'une base (de préférence orthonormale) de F :
94
Proposition 7.7. Soit H un espace de Hilbert et F un sous-espace vectoriel de dimension nie
avec (x , . . . , x ) une base de F (non nécessairement orthonormale). Soit B = ⟨x , x ⟩. Alors B est
inversible et pour tout x ∈ E, on a
1 n i,j i j
n
X
pF (x) = (B −1 )j,i ⟨xi , x⟩xj .
i,j=1
Démonstration. Pour voir que B

est inversible, il sut de montrer que les vecteurs de ces lignes
(⟨xi , xj ⟩)j=1,...,n sont linéairement indépendants. Si on a ni=1 λi (⟨xi , xj ⟩)j=1,...,n = 0, on a ⟨ ni=1 λi xi , xj ⟩
P P
=
0 pour tout j . En prenant une combinaison linéaire
n
X n
X n
X
0= λj ⟨ λi xi , xj ⟩ = || λi xi ||2 ,
j=1 i=1 i=1
Pn
donc i=1 λi xi = 0 donc comme x1 , ..., xn était une base, on obtient λi = 0 pour tout i, ce qui donne
la liberté voulue.
Pour x ∈ H, on a
n
X n
X n
X
−1 −1
⟨xk , x− (B )j,i ⟨xi , x⟩xj ⟩ = ⟨xk , x⟩− (B )j,i ⟨xi , x⟩⟨xk , xj ⟩ = ⟨xk , x⟩− (B −1 )j,i ⟨xi , x⟩Bk,j = 0
i,j=1 i,j=1 i,j=1
Pn −1
donc x− i,j=1 (B )j,i ⟨xi , x⟩xj ∈ F ⊥ donc par caractérisation de la projection orthogonale
n
X
pF (x) = (B −1 )j,i ⟨xi , x⟩xj .
i,j=1
Remarque . 7.5 Voici un cas particulier important du résultat précédent. Soit E un espace de Hilbert
et F un sous-espace vectoriel de dimension nie avec (e1 , . . . , en ) une base orthonormale de F. Alors
pour tout x ∈ E, on a
n
X
pF (x) = ⟨ei , x⟩ei .
i=1
Exemple . 7.7 Soit

2
H = L (Ω, T , µ) et A ∈ T, T (A) = {∅, A, Ac , Ω}. F =
on a vu en TD que
L2 (Ω, T (A), µ) et un espace de dimension au plus 2 engendrée par e1 = 1A , e2 = 1Ac (duR moins si
A, Ω ont mesures nis). Cette famille est orthogonale mais pas orthonormale. ||e1 ||2 = 1A dµ =
µ(A), ||e2 ||2 = µ(Ac ). Supposons ces deux nombres non nuls et nis de sorte que F a exactement
c −1
dimension 2. Alors la matrice de la proposition précédente est B = diag(µ(A), µ(A )) et B =
c 2
diag(1/µ(A), 1/µ(A )), la formule de projection donne donc pour f ∈ L (Ω, T , µ) :
Z Z
1 1
pL2 (Ω,T (A),µ) (f ) = f dµ 1A + f dµ 1Ac . (7.2)
µ(A) A µ(Ac ) Ac
Rappelons que le procédé de Gram-Schmidt permet de calculer une base orthonormale d'un espace
euclidien à partir d'une base donnée :
95
Proposition 7.8 . Soit E un espace euclidien et (e , . . . , e ) une base
(resp. une famille libre) de E. Pour chaque 0 < i ≤ n, notons F le sous-espace vectoriel Vec(e , . . . , e )
(Procédé de Gram-Schmidt) 1 n
engendré par e , . . . , e . Alors, la famille (e , . . . , e ) dénie de la manière suivante est une base or-
i 1 i
′ ′
thonormale (resp. une famille orthonormale) de E :

1 i 1 n
e1
e′1 =
∥e1 ∥
i−1
X
ei − ⟨e′k , ei ⟩e′k
e′i =
ei − pFi−1 (ei )
∥ei − pFi−1 (ei )∥
= k=1
i−1
X
pour 1 < i ≤ n
∥ei − ⟨e′k , ei ⟩e′k ∥
k=1
Exercice .
3
7.1 Vérier que les vecteurs e1 = (1, 1, 1), e2 = (1, 1, −1) et e3 = (0, 1, 1) forment une base
de IR . Utiliser le procédé de Gram-Schmidt sur cette base pour obtenir une base orthonormale.
4.2 Théorème des bases

Exemple . e (x) = exp(inx), n ∈
0
7.8 n ZZ dénit une base hilbertienne de l'espace pré-hilbertien
C2π (IR, C
l ) l'ensemble des fonctions continues 2π périodiques, muni du produit scalaire :
Z 2π
1
⟨f, g⟩ = f (t)g(t)dt.
2π 0
C'est la base des décompositions en série de Fourier (on montrera cela plus en détail dans la
section suivante). Le but est de décomposer de façon similaire tout vecteur de H comme somme
d'une série en fonction d'une base.
Théorème 7.9. Soit H un espace préhilbertien et I un ensemble dénombrable.

1. Une famille orthonormale (x ) est libre et vérie l'inégalité de Bessel, pour tout x ∈ H :
i i∈I
X
|⟨x, xi ⟩|2 ≤ ||x||2
i∈I
2. De plus une famille orthonormale (e ) est une base hilbertienne si et seulement si on a

l'égalité de Bessel-Parseval, pour tout x ∈ H :
i i∈I
X
|⟨x, ei ⟩|2 = ||x||2
i∈I
De plus, dans ce cas, pour tout x ∈ H , la série suivante converge (dans H mais pas absolument)
X
x= ei ⟨ei , x⟩.
i∈I
3. Si H est un espace de Hilbert séparable, toute famille orthonormale peut être complétée en une
base hilbertienne dénombrable (e ) de H et J : x 7→ (⟨e , x⟩) établit alors une isométrie
surjective J : H ≃ ℓ (I). En particulier, un espace de Hilbert est séparable si et seulement si
i i∈I i i∈I
2
il a une base orthonormée dénombrable.

96
Remarque . 7.6 De la formule pour x, on tire par continuité la formule pour le produit scalaire (qui
est une série absolument convergente par Cauchy-Schwarz) :
X
⟨y, x⟩ = ⟨y, ei ⟩⟨ei , x⟩.
i∈I
Démonstration.
P Comme I est dénombrable, on peut supposer et on suppose
P I = IN.
(1) Si λ i xi = 0 , on calcule λj = ⟨xj , λi xi ⟩ = 0 donc xi est bien libre. Soit Vn = V ect(ei , i ∈
[[0, n]]), on a déjà vu la formule pour la projection orthogonale sur Vn :
n
X
pn (x) = ei ⟨ei , x⟩.
i=0
Donc par la propriété de contraction de pn et l'orthogonalité
n
X n
X n
X
||pn (x)||2 = ei ⟨ei , x⟩, ej ⟨ej , x⟩ = |⟨ei , x⟩|2 ≤ ||x||2
i=0 j=0 i=0
En passant à la limite n → ∞ on obtient l'inégalité de Bessel pour la somme et on trouve en

particulier (⟨x, ei ⟩)i∈IN ∈ ℓ2 (IN).
(2) Si (ei ) est une base soit xn ∈ V ect(ei , i ∈ I) convergeant vers x.
i∈IN
2 2
De plus, pour n assez grand |||x|| − ||xn || | ≤ ϵ/2 et pour tout m,
|||pm (x)||2 − ||pm (xn )||2 | ≤ ||pm (xn − x)||(||xn || + ||x||) ≤ ||(xn − x)||(||xn || + ||x||) ≤ ϵ/2
(avec la dernière inégalité pour n assez grand) d'où en prenant m tel que pm (xn ) = xn (car xn est
dans un certain Vm comme combinaison linéaire nie des ei ), on obtient
m
X
|⟨ej , x⟩|2 − ||x||2 ≤ ϵ
i=0
et donc la somme de la série est ||x|| d'où l'égalité de Parseval.

Réciproquement, Si on a égalité, on a la limite
n
X
|⟨ej , x⟩|2 = ||pn (x)||2 →n→∞ ||x||2
j=0
et ceci implique par le théorème de Pythagore :
||pn (x) − x||22 = ||x||22 − ||pn (x)||22 →n→∞ 0
donc tout élément de H est limite d'éléments de V ect(ei , i ∈ I) d'où la propriété de densité manquante
pour obtenir une base hilbertienne.
De plus un calcul donne la formule pour x :
n
X ∞
X
||x − ei ⟨ei , x⟩||2 = |⟨ei , x⟩|2 → 0.
i=0 i=n+1
(3) Soit O la famille othonormale de départ. Soit K = V ect(O), on cherche une base ortho-
normale de K ⊥ pour compléter O, il est bien séparable comme sous espace de H. Soit (xn )n∈IN
97
une famille dénombrable dense de K ⊥ . Quitte à extraire une sous-suite, on peut supposer que
xn ̸∈ V ect(x0 , ..., xn−1 ) de sorte que (xn )n∈IN est une famille libre.
On peut donc orthonormaliser (x0 , ..., xn ) et obtenir (e0 , ..., en ) tel que V ect(x0 , ...., xn ) = V ect(e0 , ...., en ).
Par la construction, on remarque que l'orthonormalisation pour (x0 , ..., xn+1 ) on commence par les
mêmes vecteurs et on obtient donc une famille orthonormale (fn ) . Comme
n∈IN
V ect(xn , n ∈ IN) = ∪∞ ∞
n=0 V ect(x0 , ...., xn ) = ∪n=0 V ect(f0 , ...., fn ) = V ect(fn , n ∈ IN),
ces deux ensembles sont denses et donc (fn )n∈IN est une base de K ⊥ . Maintenant, O et (fn )n∈IN
forment une famille orthonormale de H et tout O est une base de K par dénition de K , donc la
décomposition orthogonale x = PK (x) + PK ⊥ (x) permet d'approcher PK (x) par un élément yn ∈
V ect(O), PK ⊥ (x) par un élément zn ∈ V ect(fn , n ∈ IN) et yn + zn ∈ V ect(O, fn , n ∈ IN) tend vers x,
d'où la densité voulue pour que {en , n ∈ IN} = O ∪ {fn , n ∈ IN} forme une base de H .
Une fois l'existence d'une base, l'isométrie est évidente par le (2), et si on a une suite (λi )i∈I dans
2
P
ℓ (I), on voit que λi ei converge par complétude comme ci-dessus et on obtient ainsi la surjectivité.
On vient de voir (en prolongeant la famille vide) qu'un espace de Hilbert séparable a une base
dénombrable. Réciproquement, un espace de Hilbert à base dénombrable est isométrique à ℓ2 (IN)
pour lequel Vect (en , n
Q
l
∈ IN} donne une famille dénombrable dense.
4.3 Exemples de base 1 : Séries de Fourier

On va obtenir un premier exemple de base en utilisant le théorème d'approximation de Weiers-
trass.
Exemple . 7.9 Montrons que en (x) = exp(inx), n ∈ ZZ forme une base hilbertienne de L2 ([0, 2π], C
l) :
Z 2π
1
⟨f, g⟩ = f (t)g(t)dt.
2π 0
D'abord, on sait que Cb0 (]0, 2π[, C

l) est dense car il contient Cc0 (]0, 2π[) qui est dense par la pro-
position D.6. Il s'agit donc presque de la complétion de l'exemple précédent.
Ensuite on vérie l'orthonormalité :
Z 2π
1
⟨en , em ⟩ = exp(i(m − n)t)dt = 1{m=n} .
2π 0
Enn, il reste à voir que V ect(en ) est dense. Or, on a V ect(en ) = {P (eix , e−ix ), P ∈ C l [X, Y ]} =
2 2 2 0
{P (cos(x), sin(x)), P ∈ C
l [X, Y ]}. Soit D = {(x, y) ∈ IR , x + y = 1}, soit f ∈ C2π (IR, C l ) On dénit
g:D→C l par g(cos(x), sin(x)) = f (x). Il est facile de voir que g est continue sur D (utiliser tan, cot
selon le point comme carte coordonnée) donc par le théorème d'approximation de Weierstrass C.7,
il existe un polynôme P tel que ||P − g||∞ ≤ ϵ donc, si Q = P (cos(.), sin(.)) ∈ V ect(en ), on a
||Q − f ||2 ≤ ||Q − f ||∞ ≤ ||P − g||∞ ≤ ϵ. D'où la densité voulue.
C'est la base des décompositions en série de Fourier.
4.4 Exemple de base 2 : Polynômes d'Hermite

L'exercice suivant est corrigé à l'annexe E en section 3. Vérier qu'une famille est orthonormée
est toujours un exercice calculatoire.
98
Exercice . 7.2 Soit H = L2 (IR, B(IR), γ) l'espace de Hilbert réel des fonctions de carrés intégrables
2
B par γ(B) = B √12π e−x /2 dx. H muni
R
pour la mesure gaussienne standard dénie pour un borélien
de la norme usuelle :
sZ
e−x2 /2
||f ||2 = |f (x)|2 √ dx.
IR 2π
Soit n
x2 /2

ne d 2 /2
Hn (x) = (−1) √ (e−x )
n! dx
(et donc H0 (x) = 1). On appelle les Hn les polynômes d'Hermite .
1. Montrer que pour n ≥ 1, Hn est un polynôme de la forme :
n−1
xn X
Hn (x) = √ + ak x k .
n! k=0
2. Montrer que (Hn )n≥0 est une famille orthonormale de H.

Montrer le résultat de densité sous-jacent pour obtenir une base est souvent plus dur. Quand
on ne peut pas utiliser un résultat connu, on utilise souvent la méthode qui consiste à montrer que
l'orthogonale est {0} en utilisant la proposition 7.5. On va donc déduire le résultat suivant de cela
et du théorème d'inversion de Fourier :
Théorème 7.10. Soit γ la mesure gaussienne standard sur IR. Alors la famille des polynômes
d'Hermite (H ) est une base orthonormale de L (IR, B(IR), γ). En particulier, les polynômes sont
2
denses dans L (IR, B(IR), γ) qui est séparable.

n n≥0
2
Démonstration. exp(−t /2)

Montrons d'abord que la série
P
H 2 ∞ (it)n
L ( , B( ), γ)
n=0
√
n! n converge dans
n
2
IR IR .
exp(−t2 /2) N (it)

P
On calcule la norme du terme général de la suite SN = n=0
√ Hn par orthonor-
n!
malité de s (Hn ) :
N N
X |(it)n |2 X (t2 )n
||SN ||22 = exp(−t ) 2
= exp(−t ) 2
≤ exp(t2 − t2 ) = 1
n=0
n! n=0
n!
(t2 )n
p ≥ q ≥ N , ||Sp+1 − Sq ||22 ≤ exp(−t2 ) ∞
P
Donc pour n=N n! →N →∞ 0. Donc Sn est de Cauchy
2
et donc converge dans L . Quitte à extraire on sait qu'elle converge presque partout, donc sa limite
2
ponctuelle sera aussi sa limite dans L . Concluons que Ft , dénie par Ft (x) = exp(itx), est la limite.
Il sut donc de voir que pour tout x ∈ IR :
∞
X (−it)n
2
Ft (x) = exp(−t /2) √ Hn (x).
n=0 n!
Ceci équivaut, vu la dénition de Hn à
∞ n
X (−it)n d 2
2 2
Ft (x) exp(t /2 − x /2) = exp(−(it − x) /2) = 2
(e−x /2 )
n=0
n! dx
99
2
ce qui est la somme de la série de Taylor en x évaluée en a = it de f (x) = exp(−x /2) (pour f somme
P∞ an (n)
l f (x + a) =
de série entière sur C n=0 n! f (x). Ceci est bien vérié car la fonction du milieu est
analytique par composée de fonctions analytiques sur C l (un polynôme et exp sont sommes de séries
entières sur C
l donc aussi leur composée).
Conclusion : on a Ft ∈ V ect(Hn , n ∈ IN).
On montre maintenant que toute fonction f ∈ L2 (IR, B(IR), γ), orthogonale à K := V ect(Hn , n ∈
IN) est nulle. On peut supposer f réelle en prenant partie réelle et imaginaire. Si f orthogonale à
tout Hn on a ⟨f, Ft ⟩ = 0 et donc
Z
u(t) = f (x)exp(itx − x2 /2) = 0.
Or si g(x) = f (x)exp(−x2 /2) g ∈ L1 (IR, λ) est équivalent à f ∈ L1 (IR, B(IR), γ) ce qui est le cas
2 1
car γ est une mesure de probabilité et donc L (IR, B(IR), γ) ⊂ L (IR, B(IR), γ). Donc on a ĝ(t) = 0
2
et par le théorème d'inversion de Fourier, g(x) = 0 presque partout, soit f = 0 dans L (IR, B(IR), γ).
⊥ ⊥⊥
Bilan pour K = V ect(Hn , n ∈ IN) K = {0} donc K = K = {0}⊥ = L2 (IR, B(IR), γ), d'où la
densité voulue.
On a utilisé le théorème suivant (peut-être vu en cours de probabilité, cf. annexe E section 4 pour
la variante sur les mesures de probabilité, cf. aussi le livre de Rudin d'analyse réelle et complexe Thm
9.11 et 9.12 pour n = 1)
Dénition 7.5. Soit f ∈ L1 (IRn , B(IRn ), λ) la transformée de Fourier de f est la fonction de t ∈ IRn :
Z
fˆ(t) = n
ei⟨x,t⟩ f (x)λ(dx).
IR
Théorème 7.11 (admis) Soient deux .

fonctions f , f ∈ L (IR , B(IR ), λ) On suppose que pour tout t ∈ IR les transformées de Fourier
(Théorème d'injectivité de la transformation de Fourier)
1 n n n
sont égales :
1 2
fˆ (t) = fˆ (t), ∀t ∈ IR .
1 2
n
Alors f = f presque partout.

De plus, si f ∈ L (IR , λ) alors f est (égale presque partout à) une fonction continue :
1 2
ˆ 1
1 n
1
Z
1
f1 (x) =
(2π)n IR n
fˆ1 (t)exp(−i⟨x, t⟩)dt.
5 Une Application : Le théorème de convergence des martin-

gales bornées dans L2(Ω, T , P ) (facultatif)
Dans cette section, on conclut par une application en probabilité. On prend (Ω, T , P ) un espace de
probabilité. Une ltration est une suite croissante de sous-tribu (Tn )n≥0 . Un exemple de telle suite est
Tn = T ((X0 , ..., Xn )) de la tribu engendrée par un vecteur aléatoire. On peut considérer les espaces
2 2
de Hilbert Hn = L (Ω, Tn , P ) ⊂ L (Ω, T , P ). C'est un sous-espace fermé car si Hn ∋ Xm →m→∞ X
on a vu au chapitre précédent, que quitte à extraire Xmk converge p.p. vers X et donc X est aussi
Tn -mesurable et donc est dans Hn . Par caractérisation séquentielle cela dit Hn fermé. On dispose
donc de la projection orthogonale PHn . EN probabilité, vous noterez PHn (X) = E(X|Tn ) et vous
interpréterez cette projection comme une espérance conditionnelle.
100
Dénition 7.6. Une suite (Xn )n∈IN est une martingale dans L 2
(pour la ltration (Tn )n≥0 si pour
tout m ≥ n PHn (Xm ) = Xn .
Cette condition dit que la moyenne de la future variable Xm , conditionnellement au présent Hn , est
Xn (si Xn est la valeur d'un gain au temps n, en moyenne on n'a rien gagné à attendre le temps
égale à
m > n). Une somme de v.a. i.i.d. dans L2 d'espérance nulle est une telle martingale. Par exemple,
la somme des n premiers termes d'une suite de variables gaussiennes centrées indépendantes donne
2
une martingale dans L . On va montrer un théorème de convergence pour les martingales bornées
2
dans L .
Théorème 7.12. Soit (T ) .Soit (X ) IN est une martingale dans H = L (Ω, T , P ) qui est une 2
suite bornée, c'est-à-dire, qu'il existe M > 0 telle que sup ||X || ≤ M . Alors X converge dans
n n≥0 n n∈
L (Ω, T , P ) vers une variable X et X = P (X).

n n 2 n
2
n Hn
p
Ce théorème se généralise à un théorème de convergence des martingales bornées dans L , 1 <
1
p < ∞. Il y a aussi une version pour les martingales L mais il faut une hypothèse technique
plus compliquée (dite d'uniforme intégrabilité). (On dit que Xn est une martingale fermée quand
Xn = PHn (X) comme ci-dessus).
Démonstration. On considère la décomposition orthogonale Hn+1 = Kn ⊕ Hn avec H0 = K0 On

2
voudrait dire que L (Ω, T (∪n≥0 Tn ), P ) = ⊕n≥0 Kn est une somme orthogonale innie, mais comme
on n'a pas introduit la notion,on va donc faire une preuve directe.
Remarquez déjà que Xn+1 − Xn = Xn+1 − PHn (Xn+1 ) ∈ Kn par la condition de martingale. Donc
par le théorème de Pythagore et une récurrence triviale, on obtient :
n
X
||Xn+1 ||22 = ||Xn+1 − Xn ||22 + ||Xn ||22 = ||X0 ||22 + ||Xk+1 − Xk ||22 .
k=0
P∞
On déduit donc de la bornitude en prenant la limite ||X0 ||22 + k=0 ||Xk+1 − Xk ||22 ≤ M 2 et donc la
série est convergente. On déduit aussi que pour p≥q≥N
p ∞
X X
||Xp+1 − Xq ||22 = ||Xk+1 − Xk ||22 ≤ ||Xk+1 − Xk ||22 →N →∞ 0.
k=q k=N
Donc (Xn ) est de Cauchy dans un espace de Hilbert donc converge vers X . Comme PHn est 1-lipschitz
donc continue, on déduit en passant à la limite dans la relation Xn = PHn (Xm ) →m→∞ PHn (X) = Xn
101
Annexe A
Compléments facultatifs au chapitre 2 :
Topologie des espaces métriques
1 Théorème de Tietze (niveau L3-M1)

Comme jolie application de la complétude, on va donner en exercice (corrigé), la preuve du
théorème de Tietze
Exercice . Extension de Tietze-Urysohn

A.1
0
Soit F un fermé de X espace métrique. Soit E = Cb (X, IR) l'espace des fonctions continues
0
bornées et p : E → Cb (F, IR) l'application de restriction ( pour f : X → IR, p(f ) = f |F est la
restriction de f à F . On va montrer que p est surjective.
1. Est-ce que E est complet ?

2. Soit g ∈ Cb0 (F, IR) avec ||g||∞ ≤ 1. Soient K1 := g −1 ([1/3, 1]) et K2 := g −1 ([−1, −1/3]). Soit :
1 d(x, K2 ) − d(x, K1 )
f (x) = , d(x, Ki ) := inf{d(x, y), y ∈ Ki }.
3 d(x, K2 ) + d(x, K1 )
(On comprend la valeur comme 0 si K1 et K2 vides et sinon, −1/3 si K1 vide, 1/3 si K2 vide).
Vérier que f ∈E
3. Montrer que ||f ||∞ ≤ 1/3 et ||p(f ) − g||∞ ≤ α = 2/3..
4. Construire une suite fn par récurrence à partir du résultat précédent telle que fn = F0 +...+Fn
et
n
X 1 2n
||Fk ||∞ ≤ (1 + ... + n )
k=0
3 3
et
2n+1
||p(fn ) − g||∞ ≤ .
3n+1
5. Montrer que fn converge. En déduire, qu'il existe F ∈ E, ||F ||∞ ≤ 1 telle que p(F ) = g.
Extension de Tietze-Urysohn (Correction)
Soit F un fermé de X espace métrique. Soit E = Cb0 (X, IR) et p : E → Cb0 (F, IR) l'application de
restriction. On va montrer que p est surjective (et un peu mieux).
1 d(x, K2 ) − d(x, K1 )
3 d(x, K2 ) + d(x, K1 )
102
1. Soit g ∈ C 0 (K) avec ||g||∞ ≤ 1. Soient K1 := g −1 ([1/3, 1]) et K2 := g −1 ([−1, −1/3]). Soit :
1 d(x, K2 ) − d(x, K1 )
3 d(x, K2 ) + d(x, K1 )
Vérions que f ∈ E, ||f ||∞ ≤ 1/3 et ||p(f ) − g||∞ ≤ α = 2/3. (on dit que p est presque
surjective)
f est continue car d(., Ki ) est continue et le dénominateur est non nul car K1 ∩ K2 = ∅ et
d(., Ki ) > 0 sur Kic .
2. Or par l'inégalité triangulaire :
1 d(x, K2 ) + d(x, K1 ) 1
|f (x)| ≤ =
3 d(x, K2 ) + d(x, K1 ) 3
donc f est bornée et ||f ||∞ ≤ 1/3.
1 1
|p(f ) − g| = 1K1 | − g| + 1K2 | − − g| + (1K − 1K1 − 1K2 )|f − g|
3 3
1 1
≤ 1K1 ||1K1 ( − g)||∞ + 1K2 ||1K1 (− − g)||∞ + (1K − 1K1 − 1K2 )(||f ||∞ + ||g(1K − 1K1 − 1K2 )||∞ )
3 3
et tous les termes sont inférieurs à 2/3 par dénition.
3. On construit construire une suite fn par récurrence à partir du résultat précédent telle que
fn = F0 + ... + Fn
n
X 1 2n
||Fk ||∞ ≤ (1 + ... + n )
k=0
3 3
et
2n+1
||p(fn ) − g||∞ ≤ .
3n+1
On prend f0 = F0 = f donné par 1 à partir de g . On prend Fn /||p(fn−1 ) − g||∞ donné par 1
à partir de −[p(fn−1 ) − g]/||p(fn−1 ) − g||∞ (si le dénominateur est 0 on s'arrête et on prend
la suite constante).
Donc on a les deux inégalités
1 1 2n
||Fn ||∞ ≤ ||p(fn−1 ) − g||∞ ≤
3 3 3n
et
2 2n+1
||p(Fn ) + p(fn−1 ) − g||∞ ≤ ||p(fn−1 ) − g||∞ ≤ n+1
3 3
2n+1
La deuxième inégalité donne ||p(fn ) − g||∞ ≤ n+1 . La première inégalité suit par l'hypothèse
3
de récurrence.
P
4. Déduisons qu'il existe F ∈ E, ||F ||∞ ≤ 1 telle que p(F ) = g. Fn P
est donc absolument
convergente dans E, donc par complétude convergente, donc soit F = ∞ n=0 Fn = lim fn . En
passant à la limite on obtient (par la somme d'une série géométrique)
∞ ∞
X 1 X 2n+1 1 1
||F ||∞ ≤ ||Fn ||∞ ≤ ≤ =1
n=0
3 n=0 3n+1 3 1 − 2/3
et ||p(F ) − g||∞ = 0 donc p(F ) = g par séparation.
103
2 Complément sur l'Espace dual (niveau début de M1)
Dénition A.1. L'espace E ′ := L(E, IK) des formes linéaires continues sur un e.v.n. E est munie
de la norme d'opérateur
||f ||E ′ := sup |f (x)|.
x∈E,||x||≤1
On a vu dans la section précédente que c'est toujours un espace de Banach. Il sera très utile
dans ce cours pour étudier E lui-même.
Le résultat suivant, conséquence de Hahn-Banach permet de décrire réciproquement la norme de
′
E en terme de celle de E (cela ressemble à la dénition de ||f ||E ′ mais c'est un théorème dicile !
que l'on exploitera pour relier E au dual du dual dans la section suivante) :
Proposition A.1. Soit (E, ||.|| ) un e.v.n., alors

E
∥x∥E = sup |f (x)| = max |f (x)|.

f ∈E ′ ,||f ||E ′ ≤1 f ∈E ′ ,||f ||E ′ ≤1
Démonstration. Par dénition, on a
sup |f (x)| ≤ sup ||f ||E ′ ∥x∥E = ∥x∥E .

f ∈E ′ ,||f ||E ′ ≤1 f ∈E ′ ,||f ||E ′ ≤1
Inversement, on applique le Théorème de Hahn-Banach B.9 à G = IRx en posant g(tx) = t||x||E

′
de sorte que g(tx)|| ≤ ||tx||E . Donc, il existe f ∈ E tel que f (x) = g(x) = ||x||E et f (y) ≤ ||y||E
c'est-à-dire ||f ||E ′ ≤ 1. En particulier, le sup est atteint en f et est donc un maximum.
On rappelle deux exemples d'espaces classiques.
Exemple . c (I)
A.1 0 est l'ensemble des suites (xi )i∈I qui tendent vers 0 dans le sens où si ϵ > 0, il
existe une partie F nie telle que |xi | ≤ ϵ pour tout i ̸∈ F. On munit c0 (I) de la norme sup :
||x||∞ = sup |xi | < ∞.

i∈I
ℓ∞ (I) est l'ensemble des suites bornée (xi )i∈I avec la même norme ||x||∞ .
Exemple . ℓ (I)
A.2
1
est l'ensemble des suites (xi )i∈I sommables, tel qu'il existe une constante C , tel
|xi | ≤ C . On munit ℓ1 (I) de la norme :
P
que pour toute partie F nie telle que i∈F
X X
||x||1 = sup |xi | =: |xi | < ∞.
F
i∈F i∈I
On étudiera la dualité des espaces Lp dans un chapitre ultérieur. Le résultat suivant donne un
exemple de calcul de dual :
Proposition A.2. Le dual de c (I) est isométrique à

0
ℓ1 (I) ≃ (c0 (I))′ .
Démonstration. On dénit T : ℓ1 (I) → (c0 (I))′ par :
X
T ((ui ))[(vi )] = ui vi .
i∈I
104
Bien sûr, on a l'inégalité montrant que T est bien déni et contractant :
X X
|T ((ui ))[(vi )]| ≤ |ui | |vi | ≤ ||c∥∞ |ui |.
i∈I i∈I
1
Montrons que T
est isométrique. Comme les suites à support ni sont denses dans ℓ (I) il sut
vi
de montrer l'égalité dans ce cas, et cela vient en posant (vi ) = 1{vi ̸=0}
|vi |
∈ c0 (I) si (ui ) à support ni
de T ((ui ))(vi ) = ||(ui )||ℓ1 . Donc comme ||(vi )||c0 ≤ 1 on a l'inégalité manquante :
||T ((ui ))||(c0 )′ ≥ ||(ui )||ℓ1 .

′
Montrons que est surjectif. Soit f ∈ (c0 (I)) et ei la suite valant 1 en i et 0 ailleurs. Soit
T
1
ui = f (ei ), montrons que (ui ) ∈ ℓ (IN). Or par l'isométrie
||(ui 1i∈F )||ℓ1 ≤ ||T ((ui 1i∈F ))||(c0 )′ = ||T ((ui )) ◦ vF ||(c0 )′ = ||f ◦ vF ||(c0 )′ ≤ ||f ||(c0 )′
car vF ((xi )) = (1i∈F xi ) est une contraction sur c0 pour F ni (et par le calcul à support ni qui suit
qui implique f ◦ vF = T ((ui )) ◦ vF ). Donc pour tout F ni :
X
|ui | ≤ ||f ||(c0 )′
i∈F
ce qui donne la sommabilité u ∈ ℓ1 (I).

Montrons enn que f = T ((ui )).
En eet, si v est à support ni, f (v) = T ((ui ))(v) par linéarité mais comme les deux côtés sont
continus en v et que (par dénition) les suites à support ni sont denses dans c0 (I), on obtient
f = T ((ui )).
Un autre résultat de base permet d'associer à une application continue u:E→F une application
t ′ ′
(dite transposée ou adjoint) entre les duaux u : F → E .
Proposition A.3. Si u : E → F est une application linéaire continue u (f ) = f ◦ u dénie une t
application linéaire continue u : F → E et on a

t ′ ′
|||ut ||| = |||u|||.
Démonstration. ′
Par composition, si f ∈ F ′, u linéaire continue,
t
f ◦ u est linéaire continue donc
appartient à E. La linéarité en f est évidente. de plus ||u (f )(x)|| ≤ ||f ||F ′ |||u|||||x||E donc
||ut (f )||E ′ ≤ ||f ||F ′ |||u|||.
Ceci donne |||ut ||| ≤ |||u|||.

Réciproquement on utilise la proposition précédente pour obtenir :
||u(x)||F = sup |(ut (f )(x))| ≤ sup ||(ut (f )||E ′ ||x||E ≤ |||ut |||||x||E .
||f ||F ′ ≤1 ||f ||F ′ ≤1
Ceci donne par dénition de la norme subordonnée, l'autre inégalité : |||u||| ≤ |||ut |||.
105
3 Bidual, Complété (niveau début de M1)
Le dual du dual E ′′ = (E ′ )′ est appelé bidual de E .
Dénition A.2. J : E → E ′′ J(x)(f ) = f (x) f ∈ E′
injection canonique
L'application qui envoie pour est appelée
de E dans E ′′ .
Proposition A.4. L'injection canonique J : E → E est une isométrie (c'est pour cela que c'est
′′
une injection).
Démonstration. En appliquant la dénition de la norme du dual puis la conséquence de Hahn-Banach
de la section précédente (proposition A.1), on obtient :
||J(x)||E ′′ = sup |J(x)(f )| = sup |f (x)| = ||x||E .

||f ||E ′ ≤1 ||f ||E ′ ≤1
On donne un exemple :
Proposition A.5.
(c0 (I))′′ ≃ (ℓ1 (I))′ ≃ ℓ∞ (I).
Démonstration. On dénit T : ℓ∞ (I) → (ℓ1 (I))′ par :
X
T ((ui ))[(vi )] = ui vi .
i∈I
Bien sûr, on a l'inégalité montrant que T est bien déni et contractant :

X X
|T ((ui ))[(vi )]| ≤ |ui | |vi | ≤ ||c∥∞ |ui |.
i∈I i∈I
Montrons que T est surjectif. Soit f ∈ (ℓ1 (I))′ et ei la suite valant 1 en i et 0 ailleurs. Soit
ui = f (ei ), alors |ui | ≤ ||f ||ℓ1 donc (ui ) ∈ ℓ∞ (I), montrons que f = T ((ui )).
En eet, si v est à support ni, f (v) = T ((ui ))(v) par linéarité mais comme les deux côtés sont
1
continus en v et que (par dénition) les suites à support ni sont denses dans ℓ (I), on obtient
f = T ((ui )).
Montrons que T est isométrique. Mais ||T (ui )|| ≥ |T (ui )(ei )| = |ui | donc ||T (ui )|| ≥ ||(ui )||ℓ∞ (I)
et on obtient donc l'égalité.
′′
Dénition A.3. L'adhérence b := J(E)E E
E dans E ′′ est appelée complété de E .
Comme c'est un espace fermé d'un espace complet, c'est un espace de Banach muni d'une injection
i:E→E
b (qui est id si E est déjà n espace de Banach). Il est caractérisé par la propriété universelle
suivante. Contrairement à la compacité qui est dure à trouver en dimension innie, la complétude
est simple grâce à cette construction, car il sut de passer au complété (mais, dans des espaces de
fonctions, il faut travailler pour décrire plus explicitement ce complété, comme espace de fonctions
concrètes).
Proposition A.6. Soit F un espace de Banach et u : E → F une application linéaire continue, il

existe une unique extension ub : E → F telle que û ◦ i = u. De plus, on a |||û||| = |||u|||.
b
106
Démonstration. (ut )t : E ′′ → F ′′ et on regarde sa restriction u
pour l'existence on considère bàE b.
b coincide avec u donc est à valeur dans F . Par densité de E , l existe une suite un → u ∈ E
Sur E , u b
et donc ub(E) ⊂ F . Or comme F est complet il est fermé dans son bidual donc F = F . Cela donne
b b b
l'existence. L'unicité vient de la densité de E dans Eb . Par la construction on a |||û||| ≤ |||u|||. L'autre
inégalité vient par densité.
4 Compléments sur la compacité et complétude (niveau L2-

L3)
Dénition A.4. Un espace métrique (X, d) est précompact si pour tout ϵ > 0, X peut être couvert
par un nombre ni de boules ouvertes de rayon ϵ.
On rappelle le résultat suivant (cf. e.g. Zuily-Quéelec Th II.1 p135 ou Gourdon d'Analyse p 32) :
Proposition A.7. Un espace métrique X est compact si et seulement si il est précompact et complet.
Démonstration. L'implication, compact implique précompact vient de la dénition. L'implication
compact implique complet vient de Bolzano-Weierstrass (vu qu'une suite de Cauchy ayant une sous-
suite convergente converge).
Réciproquement, on utilise aussi Bolzano-Weierstrass. On va construire une suite extraite de
Cauchy par extraction diagonale. Soit (xn ) suite de X .X est recouvert par un nombre ni de boules
B(a, 1) donc par principe des tiroirs, il existe une sous-suite (xϕ0 (n) ) de (xn ) contenu dans une de ces
p
boules B(a0 , 1). Par récurrence, on obtient une suite extraite (xϕ0 ◦...◦ϕp (n) ) contenu dans B(ap , 1/2 )
p p−1
en ayant choisi un recouvrement ni B(a, 1/2 ) de B(ap−1 , 1/2 ) et un terme de ce recouvrement
contenant une sous-suite de la suite-extraite précédente (xϕ0 ◦...◦ϕp−1 (n) ). On considère l'extraction
diagonale yn = xϕ0 ◦...◦ϕn (n) . Vu que ϕi (n) ≥ n car les ϕi sont strictement croissantes, ψ(n) = ϕ0 ◦
... ◦ ϕn (n) ≥ ϕ0 ◦ ... ◦ ϕn−1 (n) > ϕ0 ◦ ... ◦ ϕn−1 (n − 1) = ψ(n − 1) donc yn = xψ(n) est bien une suite
n
extraite telle que à partir du rang n, (yk )k≥n extraite de (xϕ0 ◦...◦ϕn (k) ) est dans la boule B(an , 1/2 ).
Donc yk est de Cauchy donc converge par complétude.
Théorème A.8. (de Tychonov)Un produit

Q
i∈I Xi d'espaces topologiques compacts est compact.
Comme le cas non-métrique, non-dénombrable utilise l'axiome du choix sous la forme du lemme
de Zorn, on reverra cela plus loin.
Exercice . A.2 Si I dénombrable, Xi métriques, montrer que

Q
i∈I Xi est un espace métrique compact.
(Indication utiliser le résultat précédent.)
5 Théorème d'approximation de Weierstrass (niveau L3-M1)

Théorème A.9 . Soit f : [0, 1] n
→ Cl continue et dénissons le polynôme de Bern-
stein :
(de Bernstein)
N N
X X k1 kn
BN (f )(x1 , ..., xn ) = ··· CNk1 ...CNkn f ( , ..., )xk11 (1 − x1 )N −k1 ...xknn (1 − xn )N −kn
k1 =0 kn =0
N N
Alors B N (f ) converge uniformément sur [0, 1] vers f n
107
Démonstration. On interprète de façon probabiliste BN (f ). Soit Ω = {0, 1}N n avec la mesure de
probabilité
P (ω1 = i1 , ..., ωN n = in ) = xk11 (1 − x1 )N −k1 ...xknn (1 − xn )N −kn
ω +...+ω
avec ki le nombre de 1 parmi iN (i−1)+1 , ..., iN i . On note S1 (ω) = ω1 +...+ω
N
N
, ..., Sn (ω) = N (n−1)+1N Nn
,S =
R(S1 , ..., Sn ) qui sont des variables de loi binomiales indépendantes du point de vue probabiliste. Alors
dP f (S1 , ..., Sn ) = BN (f )(x1 , ..., xn ), donc si ω(h) = sup{|f (x) − f (y)| : |x − y| ≤ h} est le module
d'uniforme continuité de f , on a :
|f (x1 , ..., xn ) − BN (f )(x1 , ..., xn )| ≤ ||f (x1 , ..., xn ) − f (S)||1 ≤ ω(δ) + 2||f ||∞ P (|(x1 , ..., xn ) − S| ≥ δ)
Or par union disjointe et l'inégalité de Markov :
n n
X X E(|xi − Si |2 )
P (|(x1 , ..., xn ) − S| ≥ δ) ≤ P (|xi − Si | ≥ δ) ≤
i=1 i=1
δ2
xi (1−xi ) 1
Or un calcul simple donne E(|xi − Si |2 ) = V ar(Si ) = N
≤ 4N
donc
2n||f ||∞
lim sup sup |f (x1 , ..., xn ) − BN (f )(x1 , ..., xn )| ≤ lim sup ω(δ) + = ω(δ) →δ→0 0.
N →∞ (x1 ,...,xn )∈[0,1]n N →∞ 4N δ 2
Corollaire A.10 Soit K un compact de IR les poly-

. n
nômes (à coecients complexes) sont denses dans C (K, Cl ). En conséquence, C (K, Cl ) est séparable.
(Théorème d'approximation de Weierstrass)
0 0
Démonstration. K
Comme K ⊂ [−N, N ]
est fermé borné,
n
f
et par le théorème de Tietze D.3,
continue sur K se prolonge en une fonction continue sur [−N, N ]n , il sut donc du cas K = [−N, N ]n
que l'on obtient par translation et dilatation (qui conservent les polynômes) du résultat précédent.
l [i]
Comme Q := Q
l + iQ
l est dense dans C, l [i]
l on voit facilement que les polynômes à coecients dans Q
sont aussi denses, et forment un ensemble dénombrable, comme union dénombrable des polynomes
de degré au plus m
en chaque variable (c'est plus simple à décrire qu'en terme de degré total) qui
Pm i1 in mn 2mn
s'écrivent sous la forme l [i]
i1 ,...,in =0 λi x1 ...xn et qui s'identient donc au produit Q ≃Q
l , qui
est dénombrable comme produit ni d'ensembles dénombrables.
Remarque . A.1 Plus généralement, le théorème de Stone Weierstrass indique que toute sous-algèbre A
(stable par conjugaison complexe) de C 0 (K, C
l ) avec K compact qui contient les fonctions constantes
et sépare les points (au sens pour x ̸= y il existe P ∈A avec P (x) ̸= P (y)) est dense pour la norme
0
uniforme :A = C (K, C l ).
6 Un résultat de compacité : le Théorème d'Ascoli (niveau L3

Math)
Les compacts sont diciles à trouver en dimension innie, et la moitié viennent (ou sont des
variantes) du résultat suivant (l'autre moitié sont des conséquences du Théorème de Tychonov), que
l'on va déduire de la relation entre complétude et compacité.
Remarque . A.2 Soit(Y, d) un espace métrique borné, dy ∈ (Cb0 (Y, IR)), dy (x) = d(y, x) la distance à
y . ||dy − dz || = supx∈Y |d(y, x) − d(z, x)| = d(y, z) (car ≤ par l'inégalité triangulaire inverse et ≥ en
0
prenant x = y ou x = z ) Donc d : Y → Cb (Y, IR) est une isométrie.
108
Dénition A.5. X, Y des espaces métriques, une partie F ⊂ C 0 (X, Y ) est
Soient équicontinue
si
pour tout ϵ > 0, il existe δ = δ(ϵ) > 0, tel que ∀x, y ∈ X, ∀f ∈ F , si d(x, y) ≤ δ alors d(f (x), f (y)) ≤ ϵ.
Par exemple une famille d'application K -lipschitziennes (comme une famille de la boule unité
fermé de rayon K des applications linéaires continues entre espaces de Banach) forme une famille
équicontinue.
Théorème A.11 . Soient X, Y des espaces métriques compacts, si une partie F est équi-
continue alors F est compacte (pour la topologie de la convergence uniforme donnée par la distance
(d'Ascoli)
d(f, g) = sup d(f (x), g(x))).

x∈X
Exercice . A.3 Montrer la réciproque facile.
Démonstration. Y
Comme compact il est complet borné doncd : Y → C (Y, )
0
0
b IR est une isométrie et
d(Y ) est complet donc fermé. Elle induit une isométrie de C (X, Y ) → C 0 (X, Cb0 (Y, IR)) qui est un
espace de Banach. Les équations f (x) ∈ d(Y ), x ∈ X montrent que l'image de l'isométrie est fermé
−1 0
(comme intersection de fermés ∩x∈X evx (d(Y )), evx (f ) = f (x)) donc complet. Donc C (X, Y ) est
aussi complet (on aurait aussi pu reprendre la preuve du cas Y Banach) et F aussi.
Il reste à voir que F est précompact. Or en recouvrant F par des boules de rayon ϵ/2, F est
recouvert par les boules de même centre et rayon ϵ, donc il sut de voir F précompact. Soit ϵ > 0,
on xe δ(ϵ) > 0 donné par l'équicontinuité et R les centres d'un recouvrement de X par des boules
de rayons δ(ϵ) donné par sa précompacité.
Remarquons que si d(f (r), g(r)) ≤ ϵ pour tout r ∈ R, en prenant r avec d(x, r) ≤ δ(ϵ), on a par
l'équicontinuité et l'inégalité triangulaire :
d(f (x), g(x)) ≤ d(f (x), f (r)) + d(f (r), g(r)) + d(g(r), g(x)) ≤ 3ϵ ⇒ d(f, g) ≤ 3ϵ.
Soit enn S
les centres des boules de rayon ϵ/2 recouvrant Y . Nous allons indicer les boules d'un 4ϵ
R R
recouvrement par les applications S de R vers S en nombre ni. Pour ϕ ∈ S , soit
Fϕ = {f ∈ F, ∀r ∈ R, d(ϕ(r), f (r)) ≤ ϵ/2}
Si f, g ∈ Fϕ alors l'inégalité triangulaire donne, d(g(r), f (r)) ≤ ϵ pour tout r donc d(f, g) ≤ 3ϵ et si
Fϕ est non-vide il est inclus dans B(bϕ , 4ϵ).
Enn, il sut donc de voir que F ⊂ ∪ϕ∈S R Fϕ . Or chaque valeur possible de f (r) est à distance
inférieure à ϵ/2 d'un s = ϕ(r) ∈ S pour un certain ϕ, ce qui conclut.
Théorème A.12 . Soient X un espace métrique compact et E un e.v.n. de dimension

nie, si une partie F est équicontinue et bornée de C (X, E) alors F est compacte (pour la topologie
(d'Ascoli)
0
de la convergence uniforme donnée par la norme ||.|| ). ∞
Démonstration. M = sup{||f || , f ∈ F } F ⊂ C (X, B (0, M )) Y = B (0, M )

Si ∞ ,
0
F et F est fermé borné
donc compact comme E est de dimension nie. Le théorème précédent conclut.
109
Annexe B
Compléments facultatifs et hors programme
au chapitre 3 : Ensembles et fonctions
convexes
1 Propriétés des Cônes tangents et normaux dans IRn

En pratique, on peut utiliser le résultat suivant pour se ramener à des cas plus simples :
Proposition B.1. Soient A, B des convexes de E.

1. Si A ⊂ B alors pour tout x ∈ A, T (x) ⊂ T (x) et N (x) ⊃ N B (x).
2. Si a ∈ Int(A), T (a) = E etPN (a) = {0}.

A B A
3. Si u , ..., u ∈ N (x) alors { λ u , λ ≥ 0} ⊂ N (x).

A A
n
4. Si a ̸= b alors N (a) = (IR(b − a)) + IR (a − b)

1 n A i=1 i i i A
⊥
et pour u ∈ [a, b] − {a, b} N (u) = (IR(b − a)) .

[a,b] +
⊥
5. Pour x ∈ A, A ⊂ x + T (x) et T = T (x) et donc N

[a,b]
A x+TA (x) A x+TA (x) = NA (x).
Démonstration. T (x) = (A − x) ⊂ T (x)

(1) A
∗
IR+ B est par monotonie de l'adhérence. Si f ∈ NB (x)
alors pour tout y ∈ TB (x) (en particulier y ∈ TA (x) on a ⟨f, x⟩ ≤ 0 et donc f ∈ NA (x). Donc on a
l'inclusion NA (x) ⊃ NB (x).
(2) a ∈ Int(A) il existe une boule donc un convexe B(a, r) ⊂ A r > 0 et donc par (1) TA (a) ⊃
TB(a,r) (a) ⊃ IR+ (B(a, r) − a) = IR+ B(0, r) = E par la dénition. Vu E ⊥ = {0} le résultat sur le cône
normal s'en déduit.
de cône. Par hypothèse pour x ∈ TA (x) on a ⟨ui , x⟩ ≤ 0 donc pour λi ≥ 0
Pn(3) C'est la propriété
⟨ i=1 λi ui , x⟩ = i=1 λi ⟨ui , x⟩ ≤ 0 et donc ni=1 λi ui ∈ NA (x).
Pn P
(4) Comme [a, b] est convexe, on obtient Tu ([a, b]) = IR+ [a − u, b − u] et u = λa + (1 − λ)b donc
(a−u) = (1−λ)(a−b), b−u = λ(b−a) donc Tu ([a, b]) = IR+ [a−u, b−u] = IR(b−a) d'où le calcul du
cône normal par l'exo 3.2. De même Ta ([a, b]) = IR+ (b−a) donc clairement f ∈ Na ([a, b]) se décompose
⊥ 2
selon la somme directe orthogonale IR(b−a)⊕(IR(b−a)) f = λ(b−a)+v et on ⟨f, b−a⟩ = λ||b−a||
⊥
qui est négatif si et seulement si λ ≤ 0. Donc si et seulement si f ∈ (IR(b − a)) + IR+ (a − b) comme
annoncé.
(5) Par la formule x+TA (x) = x+ IR∗+ (A − x) ⊃ x+(A−x) = A. Par l'inclusion Tx+TA (x) ⊃ TA (x).
Mais x + TA (x) − x = TA (x) donc Tx+TA (x) = IR∗+ TA (x) = TA (x) car TA (x) est un cône fermé. On
déduit directement le cas des cônes normaux.
110
Exemple . B.1 Soit A = {(x, y) ∈ IR2 : x ≥ y ≥ 0, }. Calculons NA (0) le cône normal en 0 = (0, 0).
D'abord on essaye de borner supérieurement l'ensemble. En prenant [(0, 0), (1, 1)] ⊂ A, on a
NA (0) ⊂ N[(0,0),(1,1)] (0) = (IR(1, 1))⊥ + IR+ (−1, −1) = {λ(1, −1) + µ(−1, −1), λ ∈ IR, µ ≥ 0}
De même
NA (0) ⊂ N[(0,0),(1,0)] (0) = (IR(1, 0))⊥ + IR+ (−1, −1) = {λ′ (0, 1) + µ′ (−1, 0), λ′ ∈ IR, µ′ ≥ 0}
Donc NA (0)
est inclus dans l'intersection, résolvons le système (−µ′ , λ′ ) = (λ − µ, −λ − µ) avec
′ ′
les conditions ci-dessus ,λ, λ ∈ IR, µ, µ ≥ 0 Il faut donc −λ − µ = −λ + µ − 2µ = µ′ − 2µ donc
N(0,0) (A) ⊂ {µ′ (−1, 1) + µ(0, −2), µ, µ′ ≥ 0}.
Montrons qu'il y a égalité en montrant que (−1, 1) ∈ NA (0) et (0, −1) ∈ NA (0) (car on a alors l'autre
inclusion par le 3 de la précédente proposition).
La formule du cas convexe donneTA (0) = A donc soit (x, y) ∈ A, on calcule ⟨(x, y), (−1, 1)⟩ =
y − x ≤ 0 d'après l'équation de A donc (−1, 1) ∈ NA (0).
Enn ⟨(x, y), (0, −1)⟩ = −y ≤ 0 donc (0, −1) ∈ NA (0) comme voulu.
On a donc
NA (0) = IR+ (−1, 1) + IR+ (0, −2).
On est maintenant prêt pour la :
Preuve du Théorème 3.6. On rappelle que
C = {x ∈ IRm : ∀i ∈ {1, ..., n}, gi (x) ≤ 0}.
On a supposé x0 ∈ Int(C) existe. Soit x∈C tel que :
1. les l premières contraintes sont actives, c'est à dire : g1 (x) = ... = gl (x) = 0
2. les autres contraintes ne sont pas actives, c'est à dire gl+1 (x) < 0, ...gn (x) < 0
Si l = 0, on a
x ∈ Int(C) = {x ∈ IRm : ∀i ∈ {1, ..., n}, gi (x) < 0}
donc NC (x) = {0} par la proposition B.1.2. Sinon, le but est de voir :
( l )
X
NC (x) = λi ∇gi (x), λi ≥ 0 .
i=1
Etape 1 : inclusion ⊃.
Par la proposition B.1.3. il sut de voir que ∇gi (x) ∈ NC (x) pour 1 ≤ i ≤ l, soit autrement dit
par dénition de NC (x), il faut voir :
⟨∇gi (x), u − x⟩ ≤ 0, ∀u ∈ C
Or par le théorème 3.12, on a ∀u, x ∈ IRm
⟨∇gi (x), u − x⟩ ≤ gi (u) − gi (x) = gi (u) ≤ 0,
car u ∈ C.
Etape 2 : inclusion ⊂.
111
Soit f ∈ NC (x).
On remarque d'abord que si on prend h0 = x0 − x on a dgi (x)(h0 ) ≤ gi (x0 ) − gi (x) = gi (x0 ) < 0
pour tout i = 1, ..., l.
Soit donc maintenant h tel que dgi (x)(h) < 0, i = 1, ..., l (il en existe par la remarque), alors
gi (x + th) − gi (x) = tdgi (x)(h) + o(t) donc gi (x + th) < 0 pour t > 0 petit, et i = 1, ...l De plus pour t
assez petit comme gl+1 (x) < 0, ...gn (x) < 0, on déduit par continuité gl+1 (x+th) < 0, ...gn (x+th) < 0
d'où x + th ∈ A pour tout t assez petit.
Par dénition de NC (x), on a donc ⟨f, x+th−x⟩ ≤ 0 donc en particulier ⟨−f, h⟩ ≥ 0 et on ne peut
pas avoir −⟨f, h⟩ < 0. Donc −f, dg1 (x), ..., dgl (x) vérient la première condition de la Proposition
n
B.15 (avec E = IR ) donc aussi la seconde et sont donc positivement linéairement dépendants. On a
Pl
donc des λi positifs non tous nuls tel que −λ0 f + λ ∇g (x) = 0.
Pl i=1 i i
Montrons enn que λ0 ̸= 0. Si on avait i=1 λi ∇gi (x) = 0, il n'y aurait pas de h tel que
dgi (x)(h) < 0 pour tout i = 1, ..., l ce qui contredit dgi (x)(h0 ) < 0.
On conclut à l'égalité voulu :
l
( l )
X λi X
f= ∇gi (x) ∈ λi ∇gi (x), λi ≥ 0
λ
i=1 0 i=1
2 Enveloppe convexe, cônes tangents et cônes normaux pour

tout e.v.n. E (Niveau L3)
Comme pour les adhérences, la stabilité par intersection garantit l'existence d'un plus petit
convexe contenant A.
Dénition B.1. L'enveloppe convexe d'un ensemble A, notée Conv(A) est le plus petit convexe
contenant A.
Lemme B.2. n
[ X X
Conv(A) = { ti xi , xi ∈ A, avec ti = 1, ti ≥ 0}
n∈ IN
∗ i=1
Démonstration. Conv ′ (A) le membre de droite. Convn′ (A) = { ni=1

Soit
′
P
Pn ti x i , xi ∈ A, avec
′
P
ti =
1, ti ≥ 0} Le cas n = 1 dans l'union est A donc A ⊂ Conv (A). Si y1 = i=1 ti xi ∈ Convn (A), y2 =
P m ′
j=1 sj zj ∈ Convm (A) sont deux points quelconques, alors pour λ ∈ [0, 1]
n
X m
X
λy1 + (1 − λ)y2 = λti xi + (1 − λ)sj zj .
i=1 j=1
Pn Pm ′
Comme i=1 λti + j=1 (1 − λ)sj = λ + (1 − λ) on déduit λy1 + (1 − λ)y2 ∈ Convn+m (A). Ceci
′
montre que Conv (A) est un convexe qui contient A.
Pn
Il est facile de voir que tout ensemble convexe est stable par combinaison convexe i=1 ti xi avec
ti = 1, ti ≥ 0 par récurrence surPn et ainsi Con′n (A) ⊂ Conv(A)
P
. Si tn = 1, les autres sont nuls et
n 1
Pn
rien n'est à montrer. En écrivant i=1 ti xi = (1 − tn )( 1−tn i=1 ti xi ) + tn xn on a par l'hypothèse de
1
Pn 1
Pn
récurrence
1−tn i=1 ti xi ∈ Conv(A) car yn := 1−tn Ptni = (1 − tn )/(1 − tn ) = 1 (et les coecients
i=1
sont positifs). Donc on a aussi la combinaison convexe i=1 ti xi = (1 − tn )yn + tn xn ∈ Conv(A).
112
n
Dans IR il ne sut que du barycentre de n+1 points.
Théorème B.3. (de Carathéodory) (admis) Si A ⊂ IR , on a n
n+1
X X
Conv(A) = ti xi , xi ∈ A, avec ti = 1, ti ≥ 0 .
i=1
Les deux ensembles suivant seront importants pour formuler des conditions pour des problèmes
de minimisation sous contrainte.
Dénition B.2. Le cône tangent de l'ensemble A⊂E e.v.n. au point a∈A est
ai − a
TA (a) := {b ∈ E : ∃ai → a, ai ∈ A, ti > 0, ti → 0 : b = lim }
ti
Le cône normal est son polaire, c'est à dire le cône convexe fermé :
NA (a) := {f ∈ E ∗ : ∀x ∈ TA (a), f (x) ≤ 0}.

Exemple . T (a)
B.2 A est toujours fermé. Si L est un s.e.v de E a ∈ L, TL (a) = L et NL (a) = L⊥ . Si
a ∈ Int(A), TA (a) = E et INA (a) = {0}.
n
Le résultat montrer l'accord avec la dénition du cas E = IR dans le cas convexe (avec l'identi-
′
cation usuelle de E à E comme pour tout espace de Hilbert.)
Proposition B.4. Si S est convexe et x ∈ S, alors T (S) est convexe et S ⊂ x + T (S). De plus,
on a
x x
u−x
Tx (S) = { , u ∈ S, s > 0}, Nx (S) = {f ∈ E ′ : ∀u ∈ S, f (u − x) ≤ 0}
s
Démonstration. ∗
IR+ (S − x) est convexe comme S − x donc en prenant l'adhérence, aussi l'ensemble
W = IR∗+ (S − x) que l'on veut montrer être TS (x). Si on a une suite (xn − x)/tn → u ∈ TS (x)
comme tous les éléments sont dan W , on obtient par fermeture aussi la limite, donc TS (x) ⊂ W.
t
Réciproquement, pour t > 0, xn :=
n
(u − x) + x = nt u + (1 − nt )x ∈ S pour n assez grand par
convexité et (xn − x)/tn = t(u − x) si tn = 1/n → 0 donc t(u − x) ∈ TS (x) comme voulu. Les autres
relations sont alors évidentes, car S − x ⊂ TS (x) (car s = 1) et par la dénition de NS (x) comme
polaire.
3 Points selles (Niveau L2-L3)

Les points critiques a qui ne sont pas des extrema peuvent être de diérents types. L'absence
d'extrema peut être visible sur une droite passant par a s'il y a un point d'inexion (comme pour
x 7→ x3 dans IR) et il peut y avoir des points critiques qui sont des maxima dans certaines directions
et des minima dans d'autres. Ces points ont un certain intérêt et seront nommés points selles.
Dénition B.3. Soit U ⊂ IRnf : U → IR et a ∈ U .

et
n
Soient deux sous-espaces vectoriels F et G supplémentaires IR = F ⊕ G (c'est à dire F ∩ G =
point selle (resp. point selle local)
1.
{0} et IRn = F + G) On dit que a est un de f selon la
n
décomposition IR = F ⊕ G si a est un minimum (resp. minimum local) pour la restriction
f|a+F de f au sous espace ane a + F , et si a est un maximum (resp. maximum local) pour
la restriction f|a+G de f au sous espace ane a + G. On parle de point selle si il existe une
telle décomposition.
113
2. Si f de classe C 1. Soit a f , un sous espace vectoriel H ⊂ IRn est un plan
un point critique de
d'inexion si pour toute droite ∆ passant par a inclus dans a + H , f|∆ n'a pas d'extrema local
en a.
Remarque . B.1 La décomposition F ⊕G d'un point selle n'est pas forcément unique et on ne demande
rien en dehors (a + G) ∪ (F + a), en particulier, il peut y avoir des plans d'inexion en un point selle
(ex f (x, y) = x2 − y 2 + (x − y)3 , (0, 0) est un point selle local dans la décomposition (IR, 0) ⊕ (0, IR)
2 3 2 3
car x + x a un minimum local en 0 et −y − y un maximum local, de même (0, 0) est un point
selle dans la décomposition IR(1, 1/2) ⊕ IR(1/2, 1) mais IR(1, −1) est une droite d'inexion)
Proposition B.5. Soit f : U → IR de classe C 1
1. Si a est un point selle de f , c'est un point critique de f .

2. Si f est C et a est un point critique de f . Si D f (a) est non-dégénérée, ni positive ni négative,
2 2
alors a est un point selle local de f .

3. Si a est un point critique de f H est un plan d'inexion en a de dimension dim(H) > n/2
alors a n'est pas un point selle local. De plus si f est C pour tout h ∈ H , D f (a)(H, H) = 0.
2 2
Démonstration.
n
Pour (1) on remarque qu'il sut de montrer df (a) = 0 ce qui ne dépend pas de la
base de IR on peut donc supposer a point selle pour la décomposition F = IRk ×{0}, G = {0}× IRn−k .
Comme f restreint à a+F k premières dérivées partielles s'annulent, les n-k
à un minimum local, les
dernières s'annulent à cause du maximum sur a + G, d'où df (a) = 0.
2
La preuve de (2) nécessite quelques bases d'algèbre linéaire. Pour (2), comme D f (a) est non
dégénérée, les valeurs propres de H(f )(a) (les racines du polynôme X 7→ det(H(f )(a) − Xid)) sont
2
non nulles. Comme la matrice D f (a) n'est ni positive ni négative, il y a à la fois des valeurs propres
λ positives et négatives. Soit F l'espace vectoriel engendré par les vecteurs propres u (les u ∈ IRn tels
que H(f )(a)u = λu qui existent car si det(H(f )(a) − λid) = 0, H(f )(a) − λid n'est pas injective donc
2
a un noyau) des valeurs propres λ strictement positives, et de même G avec les négatives. D f (a)
restreint à F est positive donc f |a+F admet un minimum local et de même pour G.
Pour (3), si dim(H) > n/2 et supposons par l'absurde a point selle, on a dim(F ) + dim(G) = n,
on a soit dim(F ) ≥ n/2, soit dim(G) ≥ n/2, disons qu'on se trouve dans le premier cas, alors
n ≥ dim(H + F ) = dim(F ) + dim(H) − dim(F ∩ H) implique dim(F ∩ H) ≥ dim(F ) + dim(H) − n >
n/2 + n/2 − n = 0 donc F ∩ H ̸= {0} une contradiction car la restriction de f à toute droite dans
a + F ∩ H devrait avoir un minimum local en a et un point d'inexion à la fois. Si D2 f (a)(H, H) ̸= 0,
on a vu que cela sut à ce que f ait un extremum local sur la droite a+ IRH, vu si ϕ(λ) = f (a+λH),
ϕ′′ (0) = D2 f (a)(H, H).
Théorème B.6. Soient A ⊂ IRn−k , B ⊂ IRk des compacts convexes et K : C = A×B → IR continue.
Si pour tout (a, b) ∈ C, a ∈ IR , b ∈ IR , x 7→ K(x, b) est convexe et y 7→ K(a, y) est concave, alors
n−k k
il existe un point de C qui soit un point selle (x , y ) selon la décomposition IR × {0} ⊕ {0} × IRn−k k
autrement dit :
0 0
∀x ∈ A, y ∈ B K(x0 , y) ≤ K(x0 , y0 ) ≤ K(x, y0 ). (B.1)
De plus, (B.1) est équivalente à l'égalité :

Minx∈A Maxy∈B K(x, y) = Maxy∈B Minx∈A K(x, y). (B.2)
114
Remarque . B.2 On a des M in et M ax au lieu d'inf et sup car des fonctions continues sur des compacts
atteignent leurs bornes (cf. la preuve pour la continuité de x 7→ Maxy∈B K(x, y) et de façon similaire
de y 7→ Maxx∈A K(x, y).
Dans le cas où f est bilinéaire, ce résultat s'appelle le théorème du min-max de von Neumann. Il
a une signication en théorie des jeux. Si f donne la valeur que gagne un joueur A en position x ∈ U
si f (x) ≥ 0 et −f (x) la valeur que gagne le joueur B (et perd le joueur A) si f (x) ≤ 0. Si A ne peut
inuencer que la direction {0} × IRk et B seulement la direction IRn−k × {0}. Alors un point selle est
un "équilibre de Nash" c'est-à-dire un point où ni A ni B n'ont intérêt à changer leur stratégie, car
si A change sa stratégie celle de B étant constante, étant donné que le point selle est un maximum,
A va perdre en gain, et de même si B change sa position avec celle de A constante, le caractère de
minimum dans la direction du changement de B montre que B ne peut que perdre plus.
Démonstration. • Maxy∈B Minx∈A K(x, y) ≤ Minx∈A Maxy∈B K(x, y) est toujours vrai. Comme
pour tout x ∈ A, y ∈ B , Minx∈A K(x, y) ≤ K(x, y) ≤ Maxy∈A K(x, y), on déduit en prenant le
max : Maxy∈B Minx∈A K(x, y) ≤ Maxy∈B K(x, y) soit en prenant un M in en x :
Maxy∈B Minx∈A K(x, y) ≤ Minx∈A Maxy∈B K(x, y).

• (B.1) ⇒ (B.2)
De plus, en considérant (x0 , y0 ) de (B.1), on a :
K(x0 , y0 ) ≤ Minx∈A K(x, y0 ) ≤ Maxy∈B Minx∈A K(x, y),

K(x0 , y0 ) ≥ Maxy∈B K(x0 , y) ≥ Minx∈A Maxy∈B K(x, y),
d'où l'égalité complète en rassemblant les 3 dernières inégalités.
• g : x 7→ Maxy∈B K(x, y) est continue.

Soit x, xn ∈ A, xn → x, soit yn (resp t) atteignant le max pour xn (resp x) c'est à dire :
Maxy∈B K(xn , y) = K(xn , yn ). Supposons que g(xn ) = K(xn , yn ) ne converge pas vers g(x).
Par compacité, on peut extraire une suite telle que yϕ(n) → Y . Par continuité de K :
g(xϕ(n) ) = K(xϕ(n) , yϕ(n) ) → K(x, Y ) < K(x, t) = Maxy∈B K(x, y) = g(x).
OrK(xϕ(n) , t) ≤ K(xϕ(n) , yϕ(n) ) donc en passant à la limite par continuité de K , K(x, t) ≤

K(x, Y ) < K(x, t), une contradiction.
• (B.1) ⇐ (B.2) On prend x0 ∈ A réalisant le minimum c'est à dire tel que :
α = Minx∈A Maxy∈B K(x, y) = Maxy∈B K(x0 , y)

Il existe par la continuité du point précédent et par compacité. De même, il existe y0 ∈ B
réalisant le maximum :
Minx∈A K(x, y0 ) = Maxy∈B Minx∈A K(x, y) = α.

Donc pour tout x ∈ A, y ∈ B , en utilisant (B.2) pour l'égalité du milieu, on obtient :
K(x0 , y) ≤ MaxY ∈B K(x0 , Y ) = α = MinX∈A K(X, y0 ) ≤ K(x, y0 ).
En prenant x = x0 , y = y 0 , on voit α = K(x0 , y0 ), ce qui dit donc que (x0 , y0 ) est un point
selle.
115
• Montrons (B.2). Considérons, pour ϵ > 0,
Kϵ (x, y) = K(x, y) + ϵ||x||22 .
Comme x 7→ ϵ||x||22 est strictement convexe, il en est de même de Kϵ (., y) pour tout y ∈B
(convexe plus strictement convexe donne strictement convexe).
Montrons que pour tout y , la fonction Kϵ (., y) a un unique minimum. En eet, si x1 ̸= x2 sont
deux minima, par stricte convexité : Kϵ ((x+y)/2, y) < Kϵ (x1 , y)/2+Kϵ (x2 , y)/2 = K(xi , y) en
contradiction avec le caractère de minimum. Donc on a un unique E(y) atteignant le minimum
de Kϵ (., y) Par le deuxième point (appliqué à −Kϵ (y, x)) fϵ (y) = Kϵ (E(y), y) est continue,
∗ ∗
donc atteint son maximum en y . En conséquence, par la dénition de fϵ et le choix de y
fϵ (y ∗ ) = Maxy∈B Minx∈A Kϵ (x, y) = Kϵ (E(y ∗ ), y ∗ ) = Minx∈A Kϵ (x, y ∗ ).
Soit x ∈ A, y ∈ B, t ∈]0, 1[, on a par concavité :
Kϵ (x, (1 − t)y ∗ + ty) ≥ (1 − t)Kϵ (x, y ∗ ) + tKϵ (x, y) ≥ (1 − t)fϵ (y ∗ ) + tKϵ (x, y).
En prenant x = E((1 − t)y ∗ + ty), on obtient fϵ ((1 − t)y ∗ + ty) ≥ (1 − t)fϵ (y ∗ ) + tKϵ (E((1 −
∗
t)y + ty), y).
∗
Vu que y maximise fϵ , en soustrayant et divisant par t, on a :
fϵ (y ∗ ) ≥ Kϵ (E((1 − t)y ∗ + ty), y) (∗).
On veut prendre t → 0, voyons que y 7→ E(y) est continue. Supposons yn → y , et supposons

E(yn ) ̸→ E(y) par compacité, on a une suite extraite yϕ(n) telle que E(yϕ(n) ) → Z ̸= E(y).
Par continuité Kϵ (E(yϕ(n) )), yϕ(n) ) → Kϵ (Z, y) > Kϵ (E(y), y),
l'inégalité stricte venant de l'unicité du minimum d'une fonction strictement convexe.
Or par dénition Kϵ (E(y)), yϕ(n) ) ≥ Kϵ (E(yϕ(n) )), yϕ(n) ) donc en passant à la limite Kϵ (E(y), y) ≥
Kϵ (Z, y) > Kϵ (E(y), y), une contradiction.
On a donc montré la continuité de y 7→ E(y).
∗ ∗
Donc en passant à la limite dans l'inégalité (∗), on obtient : fϵ (y ) ≥ Kϵ (E(y ), y) et ce pour
∗ ∗ ∗ ∗
tout y ∈ B Par ailleurs par dénition de fϵ , fϵ (y ) ≤ Kϵ (x, y ). Autrement dit (E(y ), y ) est
un point selle de Kϵ . Par l'implication (B.1) ⇒ (B.2), on déduit, vu K(x, y) ≤ Kϵ (x, y) ≤
K(x, y) + ϵD (avec D = M axx∈A ||x||22 < ∞ par compacité) :
Minx∈A Maxy∈B K(x, y) ≤ Minx∈A Maxy∈B Kϵ (x, y)

= Maxy∈B Minx∈A Kϵ (x, y) ≤ ϵC + Maxy∈B Minx∈A K(x, y).
En prenant ϵ → 0, on obtient l'inégalité qui manque pour avoir (B.2) pour K.
4 Jauge de Minkowski d'un ensemble convexe (Niveau M1)

L'un des objectifs principaux de ce chapitre est d'utiliser le théorème de Hahn-Banach pour
séparer des convexes par des hyperplans fermés, lieu d'annulation d'une forme linéaire continue.
Pour cela, nous devons associer à un convexe une fonction (qui sera souvent une semi-norme) et que
l'on pourra utiliser comme domination dans le théorème d'Hahn-Banach.
116
Dénition B.4. Soit E un IR-e.v., un convexe C ⊂ E est dit absorbant si pour tout x ∈ E, x ∈ λC
pour un λ > 0.
Dénition B.5. Soit E un IR-e.v. et C un convexe absorbant. La jauge de Minkowski de C est

la fonction :
µC (x) := inf{λ > 0 : λ−1 x ∈ C} ∈ [0, ∞)
Théorème B.7. Soit E un IR-e.v. et C un convexe absorbant. Alors

1. µ (x + y) ≤ µ (x) + µ (y).
2. µ (tx) = tµ (x) si t ≥ 0.
C C C
3. Si −C = C , µ est une seminorme.

C C
4. Si A = {x : µ (x) < 1}, B = {x : µ (x) ≤ 1} alors A ⊂ C ⊂ B sont des convexes et

C
C C
µ =µ =µ
5. Si E est un e.v.n. et 0 ∈ Int(C) (ce qui implique C absorbant), µ est continue et de plus
A B C
A = Int(C), B = C.
Démonstration. t = µC (x) + ϵ > 0, s = µC (y) + ϵ > 0 de

Soit
x+y t x s y
sorte que x/t, y/s ∈ C . Or on peut
écrire la combinaison convexe suivante
s+t
= s+t t
+ s+t s
∈C et donc µC (x + y) ≤ s + t. Comme
ϵ>0 est arbitraire, on déduit (1).
(2) est une conséquence directe de la dénition. Si −C = C µC (x) = µC (−x) d'où on déduit
µC (tx) = |t|µC (x), la seule relation manquante pour (3).
Les inclusions entreA, B, C viennent de la dénition : x ∈ C donne x/1 ∈ C et donc µC (x) ≤ 1
et si µC (x) < 1, alors x/1 ∈ C. Elles impliquent µB ≤ µC ≤ µA . Si µB (x) < s < t alors x/s ∈ B
donc µC (x/s) ≤ 1 donc µC (x/t) ≤ s/t < 1 d'où x/t ∈ A donc µA (x) ≤ t soit en passant à l'inmum
des t, µA (x) ≤ muB (x) ce qui donne la dernière égalité de (4). A, B convexes sont semblables à la
convexité des boules en utilisant (1) et (2).
Pour (5), on remarque qu'il existe B(0, ϵ) ⊂ C donc µC (ϵx/||x||) ≤ 1 soit µC (x) ≤ ||x||/ϵ.
De plus par l'inégalité triangulaire µC (x) ≤ |µC (x − y)| + µC (y) et de même en inversant x, y
donc
|µC (x) − µC (y)| ≤ |µC (x − y)| ≤ ||x − y||/ϵ
donc µC est 1/ϵ-lipschitzienne donc continue. On déduit que A est ouvert, B fermé et donc A ⊂
Int(C),C ⊂ B. Or, soit ϵ, si x ∈ B x(1 − 1/n) ∈ C et converge vers x ∈ C donc B ⊂ C . De même si
x ∈ Ac , (1 + ϵ)x ̸∈ C donc x ∈ C c donc Ac ⊂ C c d'où en prenant le complémentaire Int(C) ⊂ A.
Vous pouvez aussi en exercice essayer de montrer le résultat suivant directement.
Corollaire B.8. Soit C un convexe d'intérieur non vide d'un e.v.n., Int(C) = Int(C) et Int(C) =
C.
Démonstration. En translatant, on peut supposer 0 ∈ Int(C),, Alors comme µC = µInt(C) = µC , par

le (5) ci-dessus, le calcul de l'intérieur/adhérence en terme de la jauge donne que ces trois ensembles
ont même intérieur et même adhérence.
117
5 Séparation des convexes (Niveau M1)
Un élément f ∈ E ′ tel que f ̸= 0 permet de construire un hyperplan fermé (translation de Ker(ϕ),
voir lemma 2.30) : {x ∈ E, f (x) = c}. Les deux ensembles {x ∈ E, f (x) ≤ c} et {x ∈ E, f (x) ≥ c}
sont des demi-espaces. On dit que deux ensembles sont séparés (par l'hyperplan) si chaque ensemble
est dans un des demi-espaces. On parle de séparation stricte si C1 ⊂ {x ∈ E, f (x) < c} et C2 ⊂ {x ∈
E, f (x) > d} pour d > c.
On va obtenir un résultat de séparation en utilisant un résultat abstrait de prolongement :
Théorème B.9 (de prolongement de Hahn-Banach). (admis) Soient E un espace vectoriel, p : E →

IR une application positivement homogène et sous-additive, c'est-a-dire vériant :
p(tx) = tp(x)x ∈ E, t > 0
p(x + y) ≤ p(x) + p(y), x, y ∈ E.
Soient G ⊂ E un sous-espace vectoriel et g : G → IR une application linéaire dominée par p :
∀x ∈ G, g(x) ≤ p(x).
Alors il existe une forme linéaire f sur E qui prolonge g (c'est-à-dire ∀x ∈ G, g(x) = f (x)) et
encore dominée par p, c'est-à-dire telle que
∀x ∈ E, f (x) ≤ p(x).
La version suivante du théorème de Hahn-Banach permet de séparer des ensembles convexes bien
choisis.
Théorème B.10. Soient A, B deux convexes non-vides disjoints d'un e.v.n. E, ils sont séparés par
un hyperplan dans les deux cas suivants :
1. Si A est ouvert, alors il existe f ∈ E et c ∈ IR telle que
′
∀x ∈ A, y ∈ B : f (x) < c ≤ f (y).
2. Si A est compact et B est fermé, alors il existe f ∈ E et c < d ∈ IR telle que

′
∀x ∈ A, y ∈ B : f (x) < c < d < f (y).
Démonstration. 1) Premier cas : B = {x0 }.

On peut supposer que 0 ∈ A pour utiliser la fonctionnelle µA comme fonctionnelle sous-additive
et positivement homogène p du théorème de Hahn Banach. Soit G = IRx0 et g(tx0 ) = t.
On remarque que µA (x0 ) ≥ 1 car A = Int(A) = {x : µA (x) < 1} par le théorème B.7 et x0 ̸∈ A.
donc pour t>0 g(tx0 ) = t ≤ tµA (x0 ) = µA (tx0 ) et pour t ≤ 0 g(tx0 ) ≤ 0 ≤ µA (tx0 ). Donc on
obtient la domination hypothèse de Hahn-Banach :
∀x ∈ G, g(x) ≤ µA (x).
En appliquant le théorème, on obtient donc f linéaire étendant g et telle que (en réutilisant la
lipshitzianité obtenue dans la preuve du théorème B.7 (5))
∀x ∈ E, f (x) ≤ µA (x) ≤ M ||x||.
Ceci implique en particulier f ∈ E ∗ , f (x) < 1 pour x∈A et f (x) = 1 sur B. Ce qui donne la
séparation.
118
Second cas : B quelconque.
On pose C = A − B qui est convexe, ouvert (comme union ∪y∈B A − y ) et 0 ̸∈ C . Donc d'après le
′
premier cas il existe f ∈ E telle que f (z) < 0 pour z = a − b ∈ A − B soit f (a) < f (b) pour a ∈ A,
b ∈ B. En passant au sup on obtient :
Supx∈A f (x) ≤ Infy∈B f (y) := c.

De plus, comme A A ⊂ Int({x : f (x) ≤ c}) = {x : f (x) < c}.
ouvert on obtient
2)Vérions qu'il existe ϵ > 0
A + B(0, ϵ) et B + B(0, ϵ) soient disjoints (ce sont aussi
tel que
des convexes ouverts comme au 1). Sinon, on trouve xn ∈ A + B(0, 1/n) ∩ B + B(0, 1/n) donc
yn ∈ A, zn ∈ B avec ||yn − xn ||, ||zn − xn || ≤ 1/n. En extrayant par compacité une sous-suite
ynk → y ∈ A on obtient znk → y ∈ B, une contradiction.
′
Donc on peut appliquer le cas 1) à A + B(0, ϵ) et B + B(0, ϵ) . On obtient f ∈ E non-nulle telle
que :
∀a ∈ A, ∀z ∈ B(0, ϵ), ∀b ∈ B : f (a) + f (z) ≤ α ≤ f (b) + f (z)

En prenant des sup sur la boule unité :
∀a ∈ A, ∀b ∈ B : f (a) + ||f ||ϵ ≤ α ≤ f (b) − ||f ||ϵ.
Comme ||f || =
̸ 0, il sut de prendre c = α − ||f ||ϵ/2 < d = α + ||f ||ϵ/2.
Applications
Il vient de l'application directe au cas A = {x}, B = {y} qui sont des compacts.
Proposition B.11 . E′ sépare les points de E : Pour x ̸= y ∈ E il existe

telle que f (x) ̸= f (y).
(separation des points)
′
f ∈E
Le deuxième cas particulier permet de séparer un point et un espace fermé F
Proposition B.12. Si F ⊂ E un sous-espace vectoriel de l'e.v.n. E. Si x ̸∈ F alors il existe f ∈ E ′
telle que f (x) = 1 et F ⊂ Ker(f ).

En particulier, F = 0 ssi F est dense dans E.
⊥
La proposition précédente a des conséquences intéressantes pour comprendre l'injectivité et la

surjectivité (ou plutôt la densité de l'image) des applications linéaires en dimension innie.
On commence par un préliminaire algébrique sur l'orthogonalité dans les espaces de Banach.
Dénition B.6. Soit E un e.v.n. et F un sous-espace de E et N un sous-espace de E ′. Les ortho-

gonaux de F et N sont les sous-espaces fermés :
F ⊥ := {f ∈ E ′ , f (x) = 0x ∈ F },
⊥
N := {x ∈ E, f (x) = 0∀f ∈ N }.
Proposition B.13. Soient X, Y des e.v.n et T ∈ L(X, Y ). Alors

Ker(T t ) = [Im(T )]⊥ Ker(T ) = ⊥ [Im(T t )].
119
Démonstration.
⊥
En eet, y ∈ Ker(T t ) ssi pour tout x ∈ E , 0 = [T t (y)](x) = y(T (x)) ssi y ∈
[Im(T )] .
De même, y ∈ Ker(T ) ssi pour tout x ∈ E ∗ , 0 = x[T (y)] = [T t (x)(y) ssi y ∈ ⊥ [Im(T t )].
Proposition B.14. Soient X, Y des e.v.n et T ∈ L(X, Y ).

1. Im(T ) est dense dans Y si et seulement si T est injectif. t
2. Si X ⊂ Y , (X ) = X est la fermeture normique de X dans Y .

⊥ ⊥
Démonstration. T Pour 1,
t
Im(T ) = Ker(T ) = 0
est injectif si et seulement si
⊥ t
(proposition B.13)
ssi Im(T )
est dense par la proposition précédente.
⊥ ⊥
Pour 2, X ⊂ (X ) donc comme le terme de droite est fermé, l'adhérence est inclus. Récipro-
′
quement, soit x ̸∈ X par la conséquence de Hahn-Banach ci-dessus, soit f ∈ E telle que f (x) = 1,
⊥ ⊥ ⊥
et f ∈ X , on déduit que x ̸∈ (X ).
Le résultat suivant qu'on a utilisé pour les calculs de cônes normaux est un exercice typique
d'application de Hahn-Banach.
Proposition B.15. Soit {f : i = 1, 2, · · · , k} un ensemble ni dans E (pour un e.v.n. E). Les ′
armations suivantes sont équivalentes :

i
(1) Il n'y a aucun v ∈ E tel que f (v) < 0 pour tout i ∈ [1, n] ;
(2) L'ensemble {f : i = 1, 2, ..., k} est positivement linéairement dépendant : il existe un vecteur
i
non-nul λ = (λ , · · · , λ ) ̸= 0 avec λ ≥ 0 tel que λ f = 0.

i P k
1 k k i=1 i i
Démonstration. PMontrons premièrement le sens facile :

k
(2) ⇒ (1) P λ >0 . A partir de i
k
, on obtient
en appliquant à v , i=1 λi fi (v) = 0, Or fi (v) ≤ 0 pour tout i implique i=1 λi fi (v) < 0, donc cela
implique (1) par contraposée.
Dans l'autre sens (1) ⇒ (2), on utilise le théorème de séparation de Hahn-Banach pour
K1 = {y ∈ IRk : yi < 0, ∀i ∈ {1, 2, ..., k}}, K2 = {(f1 (v), f2 (v), ..., fk (v)) : v ∈ E}.
k
Vu que pi (y) = yi est linéaire sur IR de dimension nie, donc convexe continue, on obtient que
k −1
K1 = ∩i=1 pi (] − ∞, 0[) est une intersection nie de convexes ouverts, donc un convexe ouvert.
K2 = Im(f1 , · · · , fk ) ∋ 0 est un s.e.v de IRk , donc un convexe non-vide. (1) indique qu'ils sont
′ k
disjoints. Par conséquent le cas 1 du théorème B.10 s'applique et donne λ = (λ1 , · · · , λk ) ∈ E = IR
et c tels que :
∀x ∈ K1 , y ∈ K2 , ⟨λ, x⟩ < c ≤ ⟨λ, y⟩
.
CommeK2 est un s.e.v., pour t → 0 on a c ≤ t⟨λ, y⟩ → 0, donc c ≤ 0. De plus c ≤ ±n⟨λ, y⟩ et
|c|
donc ±n⟨λ, y⟩ ≤ −c = |c| force |⟨λ, y⟩| ≤ → 0 doncP⟨λ, y⟩ = 0.
n
1 1 1
De plus (− , · · · , −1, · · · , − ) ∈ K1 so −λi − j̸=i λj < c ≤ 0. Donc en passant à la limite,
n n n
n → ∞, on obtient −λi ≤ 0, donc λi ≥ 0. Et λ ̸= 0 vient de ⟨λ, (1, · · · , 1)⟩ < 0.
120
Annexe C
Compléments facultatifs au chapitre 4 :
Espaces mesurés.
1 Lemme de classe monotone

1.1 Dénitions
Au lemme 4.3 iii), on a vu comment on remplace les unions dénombrables par des unions crois-
santes d'une suite d'unions nies. Cela suggère que la notion d'union croissante pourrait remplacer
utilement (pour la théorie) celle d'union dénombrable et suggère la dénition suivante de classe
1
monotone.
Dénition C.1. Une classe monotone surΩ est une famille M de partie de Ω contenant Ω et stable
par diérence et unions croissantes, c'est-à-dire M ⊂ P(Ω) telle que :
1. Ω∈M
2. Si A, B ∈ M avec B⊂A alors A − B ∈ M.
[
3. Si {An , n ≥ 0} ⊂ M est une suite croissante (i.e. An ⊂ An+1 , alors An ∈ M.
n≥0
Lemme C.1. (cf. TD)

1. Une tribu est une classe monotone.
2. Une classe monotone stable par intersection nie est une tribu.\
3. Si (M ) sont des classes monotones, alors leur intersection M est une classe monotone.
i i∈I i
On peut donc parler de la plus petite classe monotone contenant une famille A ⊂ P(Ω), qui est
i∈I
l'intersection de toutes les classes contenant A, elle est notée M(A) et appelée la
A.
classe monotone
engendrée par
1.2 Le résultat principal

Théorème C.2 (Lemme de classe monotone). Soit E une famille de partie de Ω stable par intersec-
tion nie, alors la classe monotone et la tribu engendrée par E coïncident : M(E) = σ(E).
1. Comme dans le livre de Barbe-Ledoux, on suit la tradition française pour cette dénition (diérente de la
tradition anglo-saxone venant du livre de Durett de Probabilités). Attention, ce n'est pas la même dénition dans le
cours du MGA.
121
Démonstration. Par le lemme C.1 1), σ(E) est une classe monotone contenant E , donc comme M(E)
est la plus petite telle classe, on a M(E) ⊂ σ(E).
M(E) est une tribu. Par le lemme C.1 2), il sut de voir que M := M(E) est stable par
intersection binaire. On pose
K = {A ∈ M : ∀B ∈ E, A ∩ B ∈ M}.
Comme E est stable par intersection nie, E ⊂ K. On a Ω ∈ M et si A ⊂ C avec A, C ∈ K, B ∈ E ,

alors (C − A) ∩ B = (C ∩ B) − (A ∩ B) ∈ M par diérence d'ensembles de M. Enn, de même comme
intersection distribue sur les unions croissantes, K est stable par intersection croissante et donc une
classe monotone. Or elle contient E , comme ona vu, donc M(E) ⊂ K et comme par dénition
K ⊂ M(E). on a égalité.
On est maintenant prêt à dénir la classe qui va vérier la stabilité voulue par intersection :
L = {A ∈ M : ∀C ∈ M, A ∩ C ∈ M}.
On montre comme avant que L est une classe monotone (exo). Montrons que E ⊂ L. Soit donc
B ∈ E , alors C ∈ M ⊂ K donc, par dénition de K, pour B ∩ C ∈ M. Et comme c'est vrai pour
tout C ∈ M, on en déduit par dénition de L que B ∈ L, comme voulu.
Finalement, L est une classe monotone telle que E ⊂ L ⊂ M(E) donc, par dénition de la classe
monotone engendrée, L = M(E).
Inclusion réciproque. Comme M(E) est une tribu contenant E et que σ(E) est la plus petite
telle tribu, on obtient M(E) ⊃ σ(E).
Corollaire C.3. (au lemme de classe monotone) Soient µ et ν des mesures nies de mêmes masses
(i.e. µ(Ω) = ν(Ω)) sur un espace mesurable (Ω, T ). Soit E une famille stable par intersection nie
qui engendre T . Si µ et ν coïncident sur E (i.e. µ(E) = ν(E), ∀E ∈ E ) alors µ et ν sont égales (i.e.
µ(B) = ν(B), ∀B ∈ T ).
Démonstration. M = {B ⊂ E : µ(B) = ν(B)}.

Soit M
Par l'hypothèse, E
contient . Vérions que
c'est une classe monotone :
Ω ∈ M car µ et ν ont même masse.
Si A, B ∈ M, A ⊂ B , alors par la proposition 4.3 v) on a µ(B − A) = µ(B) − µ(A) =
ν(B) − ν(A) = ν(B − A).
Si A1 ⊂ A2 ⊂ · · · ⊂ An ⊂ · · · , An ∈ M, est une suite croissante, par la proposition 4.3 iii),
[ [
µ An = lim µ(An ) = lim ν(An ) = ν An .
n→∞ n→∞
n≥1 n≥1
Bilan, M est une classe monotone qui contient E, donc M(E) ⊂ M. Or par le lemme de classe
monotone M(E) = σ(E) = T d'où le résultat.
1.3 Preuve du corollaire 4.19 au lemme de classe monotone sur l'unicité

des mesures sigma-nie
On commence par le cas où la suite de parties An ∈ E est croissante.
Notons µn , νn les mesures induites par µ, ν sur An respectivement. On a deux mesures nies avec
µn (E) = µ(E ∩ An ) = ν(E ∩ An ) = νn (E) pour tout E ∈ E donc par le corollaire au lemme de classe
122
S
monotone pour les mesures nies, on déduit
S µn = νn . Pour tout B ∈ T, on a B = B ∩ ( n An ) =
n (B ∩ An ) donc par union croissante :
µ(B) = lim µn (B) = lim νn (B) = ν(B).

n→∞ n→∞
Dans le cas où la suite An n'est pas croissante, on utilise Bn = ∪ni=1 Ai qui est une suite croissante,
mais pas forcément dans E , donc il faut travailler plus pour vérier l'hypothèse pour la mesure induite
sur Bn . D'abord, par la formule de Poincaré :
n
X X
µ(∪nk=1 Ak ) = (−1)k−1 µ(Ai1 ∩ · · · ∩ Aik ) < +∞.
k=1 1≤i1 <···<ik ≤n
Et comme toutes les intersections sont dans E tous les termes de la formule sont égaux aux termes cor-
respondants pour ν donc µ(Bn ) = ν(Bn ). On considère les mesures induites pour B ∈ T (E),µn (B) =
µ(B ∩ Bn ), ν(B ∩ Bn ) = νn (B). On vient de voir que µn , νn sont nies. Montrons que pour E ∈ E
µn (E) = νn (E) En eet E ∩ Bn = ∪nk=1 (E ∩ Ak ) et en appliquant la formule de Poincaré encore (en
remarquant que les intersections sont celles d'éléments de E .
n
X X
µ(∪nk=1 (E ∩ Ak )) = (−1)k−1 µ(E ∩ Ai1 ∩ · · · ∩ Aik )
k=1 1≤i1 <···<ik ≤n
Xn X
= (−1)k−1 ν(E ∩ Ai1 ∩ · · · ∩ Aik ) = ν(∪nk=1 (E ∩ Ak )).
k=1 1≤i1 <···<ik ≤n
On conclut comme avant du corollaire au lemme de classe monotone pour les mesures nies, que
S S
µn = νn . Puis pour tout B∈T, on a B =B∩( n Bn ) = n (B ∩ Bn ) donc par union croissante :
µ(B) = lim µn (B) = lim νn (B) = ν(B).

n→∞ n→∞
2 Compléments sur les Boréliens

On rappelle que la tribu des boréliens d'un espace métrique (X, d) est la tribu engendrée par
l'ensemble des ouverts T. (cf. dénition 4.6). En pratique, il est dicile de décrire tous les boréliens
(les ouverts sont déjà diciles à décrire), mais on n'a pas besoin de description explicite (juste de
familles génératrices simples, et stables par intersections nies).
Remarque . C.1 Il existe des ensembles qui ne sont pas boréliens sur IR, et donc des fonctions non-
boréliennes. Ils ne sont pas si faciles à dénir, donc en pratique, tous les ensembles qu'on rencontrera
seront boréliens.
2.1 Espaces métriques séparables et leurs boréliens

Dénition C.2. Une partie A est dite dense dans E si Ā = E . Un ensemble est dit séparable si il
admet un sous-ensemble au plus dénombrable dense (ou autrement dit une suite dense).
Lemme C.4. Un sous-ensemble F d'un espace métrique séparable est séparable.
123
Démonstration. On peut supposer F non-vide, sinon, c'est évident (la partie vide donc nie est
dense). On xe donc x0 ∈ F
Soit un une suite dénombrable dense. Soit am,n ∈ B(um , 1/n) ∩ F si cet ensemble est non-vide,
et sinon on pose am,n = x0 . La famille {am,n , m, n ∈ IN} est nie ou dénombrable et dense car si
x ∈ F il existe d(um , x) < 1/2n donc am,2n existe car B(um , 1/2n) ∩ F est non vide et par inégalité
triangulaire d(um , am,2n ) < 1/n.
Proposition C.5. (IRn , ||.||∞ ) est séparable.

Démonstration. On a vu que Q l
n
est dénombrable comme produit d'ensembles dénombrables. Mon-
⌊px1 ⌋
n
trons qu'il est dense dans IR . En eet si x = (x1 , ..., xn ) on pose xp = (
p
, ..., ⌊pxpn ⌋ ) avec ⌊x⌋ la
partie entière de x. Donc ⌊pxi ⌋ ≤ pxi ≤ ⌊pxi ⌋ + 1 et
⌊pxi ⌋ 1
− xi ≤
p p
n n n n
donc ||xp − x||∞ ≤ 1/p →p→∞ 0. Donc vu xp ∈ Q
l , x ∈ Q
l . Comme x est arbitraire. IR ⊂Q
l
CQFD.
Exercice . C.1 Montrer que Q

l
c
est dense dans IR.
Proposition C.6. Soit (X, d) un espace métrique séparable,

alors la tribu borélienne est engendrée
par les boules ouvertes B(X) = σ B : Boule ouverte de X .
Démonstration. {B : Boule ouverte de X} ⊂ B(X)
Toute boule ouverte est un ouvert donc
et donc
en passant à la tribu engendrée : σ B : Boule ouverte de X ⊂ B(X).

Le contenu de la proposition est la réciproque. Il sut de montrer que T ⊂ σ B : Boule ouverte de X

car alors, en passant à la tribu engendré, on obtient B(X) ⊂ σ B : Boule ouverte de X .
Montrons qu'en fait, tout ouvert U est union au pus dénombrable de boules ouvertes. Comme
X est séparable, c'est aussi le cas de U . Soit D = {xn : n ∈ IN} ⊂ U une suite dense. Comme
U est ouvert, il existe rn ∈ Q l ∩]0, +∞[ tel que B(xn , rn ) ⊂ U . Soit donc A = {(xn , rn ) : rn ∈
l ∩]0, +∞[, B(xn , rn ) ⊂ U } est donc a.p.d comme sous-ensemble d'un produit d'ensembles dénom-
Q
[
brables. Donc en passant à l'union on a : B(xn , rn ) ⊂ U . Montrons que
(xn ,rn )∈A
[
U= B(xn , rn ) ∈ σ B : Boule ouverte de X
(xn ,rn )∈A
Soit x ∈ U , il existe r > 0 avec B(x, r) ⊂ U . Puis il existe n tel que d(x, xn ) < 3r et soit rn ∈ Q
l
avec r/3 < rn < r/2 (par densité de Q l dans IR= donc x ∈ B(xn , r/3) ⊂ B(xn , rn ) ⊂ B(xn , r/2) ⊂
S
B(x, r) ⊂ U donc (xn , rn ) ∈ A et x ∈ (xn ,rn )∈A B(xn , rn ). Comme x est arbitraire, on a l'insclusion
[
réciproque qui conclut : U ⊂ B(xn , rn ).
(xn ,rn )∈A
Preuvedu Corollaire 4.17.

Il sut de remarquer que B(R) = σ {{+∞}, {−∞}} ∪ {]a, b[: a < b <
a + 2} , car R est séparable ({+∞, −∞} ∪Q
l est dense car la densité sur IR coïncide avec la densité
124
usuelle vu qu'on a les mêms ouverts, cf TD 1) et que les ensembles de la partie génératrice sont les
boules ouvertes pour dR .
\ 1 1i
Il sut de noter que ]a, b[= a − ,b + ∈ σ {{+∞}, {−∞}} ∪ {[a, b] : a < b} pour
n≥1
n n
déduire que
B(R) = σ {{+∞}, {−∞}} ∪ {[a, b] : a < b}
Par le lemme 4.13, on a alors que f est mesurable si et seulement si
−1
1. f ({∞}) ∈ T
2. f −1 ({−∞}) ∈ T
3. Pour tout a < b ∈ IR, f −1 ([a, b]) ∈ T
C'est exactement le résultat voulu (et on a vu que le dernier point équivaut à la mesurabilité de la
restrition de f à IR.
2.2 Compléments : Théorème d'approximation de Weierstrass

Vous pouvez voir dans la section de compléments le corollaire A.10 pour une preuve probabiliste
basée sur la loi faible des grands nombres.
Théorème C.7 Soit K un compact de IR les polynômes (à

. n
coecients réels ou même rationnels) sont denses dans C (K, IR).

(d'approximation de Weierstrass)
0
En conséquence, (C (K, IR), ||.|| ) est séparable et sa tribu borélienne B(C (K, IR)) est dénom-
0 0
brablement engendrée (c'est à dire admet une partie génératrice au plus dénombrable).
∞
Remarque . C.2 [0, 1]

Le mouvement brownien sur, un objet probabiliste important (vu en M1) peut
0
être déni comme une probabilité sur la tribu borélienne de (C ([0, 1], IR), ||.||∞ ).
2.3 Preuve du lemme 4.6

Pour rappel, on veut montrer que
n
Y
n
B(IR )=σ ]ai , bi [, ai < bi ∈ IR .
i=1
Comme les produits d'intervalles ouverts sont des ouverts, et que les boules ouvertes pour la norme
inni sont des boules ouvertes, on a
( n )
Y
n
{B : Boule ouverte de IR , || · ||∞ } ⊂ ]ai , bi [, ai < bi ∈ IR ⊂ T .
i=1
n
Donc en prenant la tribu engendrée et en appliquant la proposition C.6 sachant que IR est
séparable par la proposition C.5, on obtient :
n
Y
n n
B(IR ) = σ {B : Boule ouverte de IR , || · ||∞ } ⊂ σ ]ai , bi [, ai < bi ∈ IR ⊂ σ T = B(IRn ).
i=1
125
3 Stabilité des fonctions mesurables
Lemme C.8. Un supremum d'une suite f n : (Ω, T ) → R de fonctions mesurables est mesurable.
Démonstration. f = sup
On note f n≥1 n et on remarque que
f −1 ([−∞, a]) = {ω ∈ Ω : sup fn (ω) ≤ a} = ∩n≥1 fn−1 ([−∞, a]).

n≥1
Or par le corollaire 4.17, on sait quefn−1 ({−∞} est dans T et aussi fn−1 (]−∞, a]) = ∪n≥1 fn−1 ([−n, a]) ∈
T par union dénombrable. Donc chaque fn−1 ([−∞, a]) ∈ T et donc par intersection dénombrable, on
−1
a f ([−∞, a]) ∈ T . Par le corollaire 4.16, on déduit que la restriction de f à IR est mesurable et
−1
donc pour tout a < b, on a f ([a, b]) ∈ T . \
−1
Enn, f ({−∞}) = ∩n≥1 fn ({−∞}) ∈ T et f −1 ({+∞}) =
−1
f −1 (]n, +∞]) ∈ T . Or f −1 (]n, +∞]) =
n≥1
f −1 ([−∞, n])c ∈ T donc par intersection dénombrable, on a bien f−1
({+∞}) ∈ T . Par la réciproque
du corollaire 4.17, on déduit que f est mesurable.
Lemme C.9. La lim sup, lim inf d'une suite f n : (Ω, T ) → R de fonctions mesurables est mesurable.
Démonstration. inf f = − sup −f
Comme n n
n n , on déduit qu'un inmum d'une suite de fonctions
mesurables est mesurable. Or, comme rappelé au chapitre précédent,
lim sup fn = inf sup fk , lim inf fn = sup inf fk

n n≥0 k≥n n n≥0 k≥n
est donc mesurable en utilisant le résultat du lemme précédent sur le suprémum (ou l'innimum) de
fonctions mesurables.
Proposition C.10. Une limite simple d'une suite f : (Ω, T ) → R de fonctions mesurables est
mesurable.
n
Démonstration. Si une suite converge simplement, on a limn→∞ fn = lim supn fn qui est donc mesu-
rable par le lemme précédent.
4 Compléments sur la construction de l'intégrale

4.1 Intégrale des fonctions étagées
La dénition 4.11 est motivée par le résultat suivant :
Lemme C.11. L'intégrale R f dµ ne dépend pas de la décomposition f (ω) = P n

ai 1Ai (ω) en
somme d'indicatrice d'ensembles deux à deux disjoints mais seulement de f .
B i=1
Démonstration. f = X a 1 ,
n
Pour i Ai il existe toujours une (unique) représentation canonique de f en
i=1
voyant b1 < · · · < bm tel que l'image f (Ω) − {0} = {b1 , · · · , bm } et en prenant Bi = f −1 ({bi }) ∈ T
Xn
car f est mesurable. Alors, on a f (ω) = bi 1Bi (ω). Comme les Ai sont 2 à deux disjoints, on voit
i=1
126
X
Bj comme union disjointe de Ai et donc µ(Bi ∩ B) = µ(Aj ∩ B) donc, en regroupant par
{j:aj =bi }
paquet :
Z n
X m
X X m
X
f dµ = ai µ(Aj ∩ B) = bi µ(Ai ∩ B) = bi µ(Bi ∩ B).
B j=1 i=1 {j:aj =bi } i=1
C'est la formule qui ne dépend que de f (comme sa représentation canonique).

Pn Pn
R f (ω) =Pni=1 ai 1Ai (ω) avec Rles Ai deux à deux disjoints, alors 1B f (ω) = i=1 ai 1Ai ∩B (ω).
1. Si
Donc
B
f dµ = i=1 ai µ(APin∩ B) = Ω 1B f dµ. R Pn R
2. De même, cf (ω) =
Pm i=1 ca i 1A i
(ω), alors
B
cf dµ = i=1 ca i µ(A i ∩ B) = c f dµ.
B S
m
3.Si de plus h =
Sn j=1 bj 1Bj (ω) avec les Bj deux à deux disjoints, et soit B0 = Ω − j=1 Bj , A0 =
Ω − i=1 Ai , alors les A ∩
Pm i Pn j B deux à deux disjoints i
Pm Pn= 0, · · · , n, j = 0, · · · , m . De même, avec
a0 = b0 = 0, f (ω) = j=0 i=0 ai 1Ai ∩Bj (ω), h(ω) = j=0 i=0 bj 1Ai ∩Bj (ω). Donc
m X
X n
f (ω) + h(ω) = (ai + bj )1Ai ∩Bj (ω)
j=0 i=0
On obtient donc :
Z m X
X n m X
X n Xm X
n Z Z
f +hdµ = (ai +bj )µ(Ai ∩Bj ) = ai µ(Ai ∩Bj )+ bj µ(Ai ∩Bj ) = f dµ+ hdµ.
B j=0 i=0 j=0 i=0 j=0 i=0 B B
Si 0 ≤ f ≤ h alors h = (h − f ) + f est la
R4. R R R somme de deux fonctions étagées positives et par le
3,
B
f dµ ≤ B f dµ + B (h − f )dµ = B hdµ.

On va utiliser que toutes les propriétés sont vraies si f, h sont étagées par dénition de l'intégrale
dans ce cas.
R R
g étagée avec g ≤ fR alors g ≤R h, donc par dénition 0 ≤ B gdµ ≤ B hdµ. En passant au
1. Soit
sup sur les g , on obtient 0 ≤ f dµ ≤ B hdµ.
B R
2. Soit g étagée avec g ≤ f , alors 1B g ≤ 1B f . Or par le cas étagé du lemme 4.20, on a gdµ =
R R R R B
1
RΩ B gdµ et
R donc par dénition :
B
gdµ = 1
Ω B
gdµ ≤ 1
Ω B
f dµ. En passant au sup, on obtient
B
f dµ ≤ 1
Ω B
f dµ.
En sens inverse, g étagée positive avec g ≤ 1B f ≤ f vérie donc g1B = g et par dénition
R R R R R R
Ω
gdµ = Ω g1B dµ = B gdµ ≤ B f dµ soit en passant au sup Ω 1B f dµ ≤ B f dµ. R
Le cas particulier vient du 1. appliqué à l'inéaglité 1A f ≤ 1B f sous la forme : 0 ≤ f dµ =
R R R A
1 f dµ ≤ Ω 1B f dµ = B f dµ.
Ω 1
3. Si c = 0 c'est évident, on suppose donc c > 0. Alors pour g ≤ f avec g étagée positive, on a
R R R
cg ≤ cf donc par le cas étagé du lemme 4.20, on a c B gdµ = B cgdµ ≤ B cf dµ. En passant au
sup, on a obtenu : Z Z
c f dµ ≤ cf dµ
B B
127
mais en appliquant ) cf à la place de f f = 1c cf , on obtient :
et
Z Z Z
1 1
cf dµ ≤ c f dµ = f dµ
c B B c B
R R
d'où l'inégalité dans l'autre sens
B
cf dµ ≤ c B f dµ et donc l'égalité.
4. Si f = 0 0 ≤ g ≤ f implique g = 0 et en passant au sup de 0, on obtient le résultat.
R R Pn R Pn
Si µ(B) = 0,
B
gdµ = Ω
1B gdµ et si g(ω) = i=1 a i 1A i
(ω) , on a
Ω
1B gdµ = i=1 ai µ(B ∩ Ai ) =
0 car chaque µ(B ∩ Ai ) ≤ µ(B) = 0.
5. Si on a 0 ≤ g ≤ f , 0 ≤ k ≤ h avec g, k mesurable positive, alors g + k ≤ f + h est mesurable
R R R R
positive, donc
B
f + hdµ ≥ B g + kdµ = B gdµ + B kdµ. En passant au sup, on obtient le résultat.
128
Annexe D
au chapitre 6 : Espaces Lp
1 Formule alternative de la norme (niveau L3)

On va en déduire l'expression alternative suivante dont l'inégalité triangulaire se déduit facilement.
Cette méthode a l'avantage d'être utile pour le calcul du dual.
Proposition D.1. Soit µ σ-nie, p ∈ [1, ∞], q tel que 1/p + 1/q = 1 le coecient conjugué, alors
pour tout g mesurable
Z
||g||q = sup{ f gdµ ; ||f ||p ≤ 1, f g ∈ L1 (Ω, µ), f ∈ L1 (Ω, µ) ∩ L∞ (Ω, µ)}.
Proof :
q
Soit croissant telle que ∪An = Ω, µ(An ) < ∞. On commence par le cas g ∈ L (Ω, µ).
An
1
Par Hölder, f g ∈ L donc l'intégrale est dénie (avec la condition ||f ||p ≤ 1 seule) et
Z
| f gdµ| ≤ ||f g||1 ≤ ||f ||p ||g||q
d'où ||g||q est plus grand que le sup de l'énoncé. Mais, pour p ∈]1, ∞[, si on prend f = g|g|q−2 /||g||q−1 q
p p(q−1) p(q−1)
on a |f | = |g| /||g||q = |g|q /||g||qq car p(q − 1) = qp(1 − 1/q) = q , donc f ∈ Lp et ||f ||pp =
E(|f |p ) = ||g||qq /||g||qq = 1. Donc ||f 1An ||pp ≤ ||f ||pp ≤ 1 donc comme Lp (An , µ) ⊂ L1 (An , µ) car
µ(An ) < ∞ on a f 1An ∈ L1 (Ω, µ) et donc
f 1An
gn,m (f ) = 1{f 1An ̸=0} min(m, |f 1An |) ∈ L∞ (Ω, µ) ∩ L1 (Ω, µ)
|f 1An |
d'où le sup est supérieur à
Z Z Z
gn,m (f )gdµ →m→∞ f 1An gdµ →n→∞ f gdµ
R R
(par convergence dominée par |gn,m (f )g| ≤ |f g|) et le sup est supérieur à f gdµ = |g|q dµ/||g||q−1
q =
||g||q . On déduit donc l'égalité énoncée.
p = 1, q = ∞, soit C > sup{ f gdµ ; ||f ||1 ≤ 1f g ∈ L1 (Ω, µ), f ∈ L1 (Ω, µ) ∩ L∞ (Ω, µ)} et
R
Si
A = {x : |g(x)| > C}. Supposons par l'absurde que µ(A) > 0 soit B ⊂ A avec µ(B) ∈]0, ∞[.
129
g
L∞ )
R
Alors f = 1B |g|µ(B) est dans L1 et ||f ||1 = 1 (et borné par 1/µ(B) donc dans mais f gdµ =
R |g|
1B µ(B) ≥ C en contradiction avec le choix de C donc µ(A) = 0 ce qui implique ||g||∞ ≤ C ce qui
donne le résultat en prenant l'inf des C .
g
Si p = ∞, q = 1, il sut de prendre f = 1g̸=0 |g| ∈ L∞ (Ω) et f 1An ∈ L∞ (Ω) ∩ L1 (Ω) de sorte que
R
f 1An g = |f |1An et la norme ||f 1An ||∞ ≤ 1. Donc le supremum, est supérieur à |f |1An dµ → ||f ||1
par convergence monotone.
g
Si on ne suppose plus g ∈ Lq (Ω, µ) mais ||g||q = ∞. Soit alors gn,m = 1{g̸=0} |g| min(m, |g|)1An ∈
∞
Lq (Ω, µ) on obtient
1 p
fn,m,k ∈ L ∩ L de norme ≤ 1 dans L tel que
Z
| fn,m,k gn,m | →k→∞ ||gn,m ||q .
Comme on a l'inégalité par Hölder,

Z
| fn,m,k (gn,m − g1An )| ≤ ||fn,m,k ||p ||(gn,m − g1An )||q ≤ ||(gn,m − g1An )||q →m→∞ 0
par convergence monotone car | min(|g|, m) − |g||q décroit vers 0, on trouve une suite mk tel que
Z
| fn,mk ,k g1An | →k→∞ ||g1An ||q
(ni ou inni). Enn comme par convergence monotone ||g1An ||q → ||g||q , on trouve une suite
Z
| fnk ,mk ,k g1An | →k→∞ ||g||q = ∞.
Comme ||fnk ,mk ,k 1An ||p ≤ 1, et fnk ,mk ,k 1An ∈ L1 ∩ L∞ et fnk ,mk ,k g1An ∈ L1 cela donne la solution :
Z
sup{ f gdµ ; ||f ||p ≤ 1, f g ∈ L1 (Ω), f ∈∈ L1 ∩ L∞ } = ∞ = ||g||q .
Exemple . D.1 Dans le cas où µ est la mesure de comptage sur I (σ -nie si I dénombrable), µ(A) =
Card(A), on obtient l'espace ℓp (I, IK) des suites indicées par I de puissance p sommable, i.e. telles
que
X
|xi |p < ∞
i∈I
pour p ∈ [1, ∞[ et l'ensemble des suites bornées, c'est-à-dire telles que
||x||∞ = sup |xi | < ∞

i∈I
pour p = ∞.
2 Premiers résultats de densité (niveau M1)

On rappelle qu'une fonction étagée intégrable sur (Ω, µ, T ) est une combinaison linéaire (nie)
de fonctions indicatrices 1A avec µ(A) < ∞.
130
Lemme D.2. Soit (Ω, µ, T ) un espace σ-ni. L'ensemble S des fonctions étagées intégrables est
dense dans tous les L (Ω, µ, T ), 1 ≤ p < ∞. En particulier, L (Ω, µ, T ) ∩ L (Ω, µ, T ) est dense dans
p 1 ∞
L (Ω, µ, T ) pour 1 ≤ p < ∞.

p
Démonstration. Cela vient de la construction de l'intégrale, et du fait que les fonctions étagées
1 ∞
sont dans L (Ω, µ, T ) ∩ L (Ω, µ, T ), mais rappelons une preuve. En décomposant en parties réelle
p
et imaginaire puis parties positive et négative, on se ramène à approcher f ∈ L avec f ≥ 0. Si
Ω = ∪An µ(An ) < ∞, on a ||f 1An − f ||p → 0 par convergence dominée, donc on prend h = f 1Am .
On prend
4 n 4 n
X k X k
hn (x) = 1[ kn , k+1n [
(h(x)) = 1 −1 k k+1 (x) ≤ h(x)
k=0
2n 2 2
k=0
2n h ([ 2n , 2n [)
Comme h mesurable, il est facile de voir que h ∈ S,
1
||h − hn ||p ≤ ||h1h(x)≥2n ||p + ||1h(x)≤2n 1Am ||p
2n
et le premier terme tend vers 0 par convergence dominée (par |h|p ), le second car µ(Am )1/p < ∞.
Donc h puis f sont dans l'adhérence.
Pour obtenir un résultat de densité des fonctions continues, on a besoin d'un résultat de continuité
sur un grand ensemble pour les fonctions mesurables. On a besoin d'une compatibilité entre théorie
de la mesure et topologie qui fait l'objet de la dénition suivante. L'essentiel est que la mesure de
n
Lebesgue sur IR est un exemple de mesure de Radon, ainsi que toutes les mesures à densité par
rapport à la mesure de Lebesgue (et aussi les mesures discrètes).
Dénition D.1. Une mesure de Radon positive sur X localement compact est une mesure positive
dénie sur une tribu T contenant la tribu borélienne B et telle que :
1. µ(K) < ∞ pour K compact (on parle de mesure de Borel).
2. µ est extérieurement régulière au sens où pour tout E ∈T, on a :
µ(E) = inf{µ(V )|E ⊂ V, V ouvert }
3. µ vérie pour tout E ouvert et E∈T avec µ(E) < ∞, on a :
µ(E) = sup{µ(K)|E ⊃ K, K compact }
4. T est complète pour µ au sens où si E ∈T,A⊂E et µ(E) = 0 alors A∈T.
On va utiliser deux lemmes topologiques (en fait reliés) :
Théorème D.3 (de prolongement de Tietze). (exo en section A) Soit X un espace métrique, F un
fermé de X et f : F → IR une fonction continue bornée par C , alors il existe une fonction g : X → IR
bornée par C et prolongeant f .
On rappelle qu'un espace topologique est ditlocalement compact si tout point a un voisinage
(d'adhérence) compact. [Rmq : pour nous, un voisinage d'un point n'est pas forcément ouvert, c'est
n
seulement un ensemble contenant un ouvert contenant le point] Par exemple c'est le cas de X = IR !
131
Lemme D.4 (d'Urysohn). Si X est un espace métrique localement compact, V un ouvert contenant
un compact K , alors il existe f continue à support compact tel que 1 ≤ f ≤ 1 . K V
Démonstration. Pour tout x∈K U

, soit V
x voisinage ouvert d'adhérence compact inclus dans
c
(pour
voir que l'adhérence peut être inclus dans V il sut d'intersecter le voisinage avec {y : d(y, V ) > ϵ/2}
c n n
pour ϵ = d(x, V )). On recouvre K par un nombre ni de Ux , K ⊂ U := ∪i=1 Uxi et U = ∪i=1 Uxi est
c
compact et on trouve un ouvert d'adhérence compact W , V ⊃ W ⊃ U et on pose F = W ∪ K. On
dénit g : F → IR par g = 1K . Si xn ∈ F , xn → x ∈ K nécessairement pour n grand xn ∈ U donc
xn ∈ K donc g(xn ) = g(x) = 1. De même si x ∈ W c , pour n grand, xn ∈ (U )c , donc xn ∈ W c et
g(xn ) = g(x) = 0. Donc g est continue sur F et s'étend en une fonction f : X → IR continue par le
théorème précédent et en centrant on a même, 0 ≤ f ≤ 1 (|f − 1/2| ≤ 1/2). Donc le support de f
est dans W compact et 1K ≤ f ≤ 1W ≤ 1V ce qui conclut.
Théorème D.5 (de Lusin). Soit X un espace métrique localement compact. µ une mesure de Radon
positive. Soit f une fonction complexe mesurable sur X s'annulant en dehors de A avec µ(A) < ∞.
Alors, pour tout ϵ > 0, il existe g continue à support compact avec sup |g(x)| ≤ sup |f (x)| et
telle que : x∈X x∈X
µ({x : f (x) ̸= g(x)}) ≤ ϵ.

Démonstration. Cas A compact, 0 ≤ f ≤ 1. On pose
2n
X k
fn (x) = 1 k k+1 (f (x)) ≤ fn+1 (x) ≤ f (x).
k=0
2n [ 2n , 2n [
1
P2n+1 1
Remarquons que tn := fn+1 (x) − fn (x) = 2n+1 k=0 1[ 2k+1 2k+2 (f (x)) =
n+1 , n+1 [
1 , (f−1
2n+1 Tn
:= 0) avec
2 2
Tn ⊂ A de sorte que :
∞
X
f (x) = tn (x).
n=−1
Comme dans la preuve du lemme d'Urysohn, il existe un ouvert A ⊂ V avec V compact, puis par
Vn ouvert avecTn ⊂ Vn ⊂ V et enn par intérieure régularité sur les
régularité extérieure, on trouve
−n−2
ensembles de mesures nies Kn ⊂ Tn avec µ(Vn − Kn ) ≤ 2 ϵ. Par le lemme d'Urysohn, on trouve
hn continue à support compact avec 1Kn ≤ hn ≤ 1Vn . On pose
∞
X
g(x) = 2−n−1 hn (x).
k=−1
Par convergence uniforme (car normale) de la série, g est continue, à support compact car inclus
−n−1
dans V . Enn 2 hn (x) = tn (x) sauf sur Vn − Kn donc f = g sauf sur ∪n (Vn − Kn ) qui est de
mesure au plus ϵ
Cas A quelconque, 0 ≤ f ≤ 1. Par régularité, on prend A ⊂ V ouvert, K⊂V compact avec
c c c
µ(A ∩ K ) ≤ µ(V ∩ K ) ≤ ϵ/2 et on applique à f 1K (vu {f 1K ̸= f } ⊂ A ∩ K ) le cas précédent en
remplaçant ϵ par ϵ/2.
Cas général Soit Bn = {x|f (x)| > n} de sorte que ∩Bn = ∅, comme µ(B1 ) < ∞ en utilisant le
TCM sur 1B1 −1Bn , µ(Bn ) → 0, on applique à (1−1Bn )f en décomposant la fonction en somme de 4n
fonctions à valeur [0, 1] (4 pour décompositions en parties positives, négatives des parties imaginaires
et réelles, et ces fonctions sont dans [0, n] d'où la décomposition en somme de n fonctions à valeurs
[0, 1]). Enn pour avoir l'inégalité on remplace g par ϕ ◦ g avec ϕ(x) = x, |x| ≤ R = supx∈X |f (x)| ,
ϕ(x) = Rx/|x|, |x| > R. On a g(x) = ϕ ◦ g(x) pour tout x tel que f (x) = g(x), donc on n'augmente
pas l'ensemble sur lequel f et g dièrent.
132
Corollaire D.6. Soit (X, µ, T ) un espace métrique localement compact avec µ mesure de Radon σ-
nie. L'ensemble C (X) des fonctions continues à support compact est dense dans tous les L (X, µ, T ), p
1 ≤ p < ∞. De plus si f ∈ L (X, µ, T ) et f ϕ = 0, pour tout ϕ ∈ C (X) alors f = 0 p.p.

c R p
c
Démonstration. S
Par le lemme précédent, il sut d'approcher les éléments de . Par le théorème de
Lusin D.5, pour chaque f ∈ S , ϵ > 0, on a g ∈ Cc (X) avec µ(g ̸= f ) ≤ ϵ et sup |g| ≤ sup|f | = C donc
||f − g||p ≤ 2Cµ(g ̸= f )1/p et cette quantité est arbitrairement petite. Pour R le résultat d'annulation,
q
si p > 1, On utilise la densité dans L , q exposant conjugué, pour obtenir f g = 0 pour g ∈ Lq , d'où
on déduit ||f ||p = 0 par la proposition D.1. Si p = 1, on remplace f par f |V avec V ouvert V compact,
qui couvrent X par locale compacité de sorte qu'on peut supposer µ(X) < ∞. On peut supposer f
−1 −1
réelle. Soit f1 ∈ Cc (X) avec ||f − f1 ||1 ≤ ϵ, K1 = f1 ([ϵ, ∞[) et K−1 = f1 (] − ∞, ϵ]) sont compacts,
on prolonge par le Théorème de Tietze D.3, u ∈ Cc (X) valant ϵ sur Kϵ et soit K = K1 ∪ K−1 . Donc
Z Z Z Z Z
||f1 ||1 = f1 u + |f1 | ≤ f1 u + 2 |f1 | ≤ ϵ + f u + 2µ(X − K)ϵ ≤ ϵ + 2µ(X)ϵ
K X−K X X−K X
car |f1 | ≤ ϵ sur X − K. Donc ||f ||1 ≤ 2ϵ + 2µ(X)ϵ pour tout ϵ>0 ce qui donne f = 0.
Donnons une application.
Proposition D.7. Soit 1 ≤ p < ∞ et soit τ f (x) := f (x + h) pour h, x ∈ IR , f ∈ L (IR ). La d p d
translation τ : L (IR ) → L (IR ) est isométrique et pour tout f ∈ L (IR ) h 7→ τ (f ) est continue
h
p d p d p d
de IR → L (IR ).
h h
d p d
Démonstration. L'isométrie est évidente par invariance de la mesure de Lebesgue par translation.
Montrons que ||τh f − f ||p →h→0 0. En eet pour ϵ > 0, par densité du lemme D.6, on trouve
f1 ∈ Cc (IRd ) avec ||f1 − f ||p ≤ ϵ/3 donc comme τh est une isométrie : on obtient :
||τh f −f ||p ≤ ||τh f1 −τh f ||p +||τh f1 −f1 ||p +||f1 −f ||p ≤ 2ϵ/3+Leb(B(0, ||h||)+Supp(f1 ))1/p ||τh f1 −f1 ||∞
Pour h assez petit, comme f1 est uniformément continue (car continue à support compact et
par le Théorème de Heine), on peut trouver 1 ≥ δ > 0 de sorte que si ||h|| ≤ δ , ||τh f1 − f1 ||∞ =
supx |f1 (x + h) − f1 (x)| ≤ ϵ/[3Leb(B(0, 1) + Supp(f1 ))1/p ] ce qui conclut.
3 Dualité des espaces de Lebesgue Lp(Ω) (Niveau M1)

On rappelle que (Ω, µ) est un espace mesuré σ -ni. On se souvient que pour p ∈ [1, ∞], q tel que
1/p + 1/q = 1 la proposition D.1 donne pour g mesurable :
Z
||g||q = sup{ f gdµ ; ||f ||p ≤ 1, f ∈ L1 (Ω, µ) ∩ L∞ (Ω, µ), f g ∈ L1 (Ω, µ)}.
On a même le théorème suivant (on notera que p<∞ contrairement au cas de la formule pour
la norme ) :
Théorème D.8. (de représentation de Riesz L ) Soit l'application dénie grâce à l'inégalité de
p
Hölder :
Z
q p
I : f ∈ L (Ω, µ) 7→ (g ∈ L (Ω, µ) 7→ f gdµ)
Alors I : L (Ω, µ) → (L (Ω, µ)) , réalise une isométrie SURJECTIVE pour p ∈ [1, ∞[ et q exposant
q p ′
conjugué c'est-à-dire tel que 1/p + 1/q = 1.

133
Attention le cas p=∞ L∞ (Ω)′
est EXCLU... est un espace très gros de mesures sur un espace
∞ 0
stonien compact X tel que L (Ω) = C (X).
Proof :
On a déjà montré l'isométrie, il reste à voir la surjectivité.
An avec µ(An ) < ∞ et ∪n∈IN An = Ω, An croissant.
On xe
Le cas p = 2 a été traité par le théorème de représentation de Riesz.
(1) cas p = 1Soit ϕ ∈ (L (Ω, µ)) avec ||ϕ|| ≤ 1. D'abord on dénit T application linéaire continue
1 ′
2
sur L (Ω) (en fait à valeur dans son dual identié à lui même) par :
⟨T x, y⟩ = ϕ(xy)
vu que xy ∈ L1 (Ω) par Hölder et on a
||T || := sup{||T x||2 , ||x||2 ≤ 1} = sup{|⟨T x, y⟩|, ||x||2 ≤ 1, ||y||2 ≤ 1} ≤ ||ϕ||L1 (Ω)′ .
La première égalité est la dénition de la norme des applications linéaires bornées, la deuxième est
le résultat de dualité du cas p = 2, la troisième utilise Hölder et la dénition de la norme du dual.
∞
Notons que si z ∈ L (Ω),
⟨T zx, y⟩ = ϕ(zxy) = ⟨T x, zy⟩ = ⟨zT x, y⟩
la deuxième relation en utilisant la commutativité des espaces de fonctions soit la relation

R zxy = xzy
et la seconde la dénition du produit scalaire ⟨T x, zy⟩ = T xzydµ. donc on déduit si mz est la
∞ ∞
multiplication par z ∈ L , T mz = mz T. Montrons que T = mg pour g ∈ L . (on dit que cette
2
algèbre est son propre commutant dans B(L (Ω)), ou qu'elle est maximale commutative).
2
En eet, soit xn = T (1An ) ∈ L . On a ||T || ≤ 1 car ||ϕ|| ≤ 1.
∞
Pour g ∈ L avec ||g||1 ≤ 1,
Z Z Z
−1/2
| T (1)gdµ| = | (|g|1/2
T )(1)g|g| dµ| = | T (|g|1/2 )g|g|−1/2 dµ| ≤ |||g|1/2 ||2 ||g|g|−1/2 ||2 = ||g||1 ≤ 1
où on a utilisé à la deuxième égalité la commutation avec m|g|1/2 . On voit donc par la formule de
la proposition D.1 que ||T (1An )||∞ ≤ 1. Comme T (1Am ) = T (1Am 1An ) = 1Am T (1An ) donc on dénit
g(x) = T (1An )(x) pour x ∈ An de façon cohérente de sorte que g1An = T (1An ) d'où ||g||∞ =
supn ||g1An ||∞ ≤ 1.
∞ 1 2 2
Et pour z ∈∈ L ∩ L ⊂ L T (z1An ) = mg (z1An ) donc par densité dans L T = mz . Enn pour
1 1/2 2
f ∈ L (Ω) f = |f | g avec g ∈ L , on obtient
ϕ(f ) = ϕ(|f |1/2 g) = ⟨T (|f |1/2 ), g⟩ = ⟨z(|f |1/2 ), g⟩ = I(z)(|f |1/2 g) = I(z)(f ).
donc ϕ = I(z) d'où la surjectivité de I .

(2) cas p > 1 µ(Ω) < ∞ utilisant les cas p = 1, 2. (On l'appliquera ensuite à Ω = An .) Après
normalisation, on peut supposer µ(Ω) = 1.
p ′ 1
On commence par montrer que via I , L (Ω) ⊂ L (Ω). Si p ≤ 2, c'est évident par l'inclusion
L2 (Ω) ⊂ [Lp (Ω)] et par restriction et théorème de representation de Riesz, on obtient g ∈ L2 (Ω) ⊂
L1 (Ω) tel que
ϕ|L2 (Ω) (f ) = ⟨g, f ⟩
Si p>2 pour x ∈ L∞ , etϕ ∈ (Lp )′ ,
Z Z
|ϕ(x)| ≤ |x| dµ ≤ |x|2 ||x||∞
p p p−2
dµ ≤ ||x||22 ||x||p−2
∞ .
134
P Q
Par l'inégalité d'Young (cas particulier d'Holder utilisé dans sa preuve) |ab| ≤ a /P +b /Q utilisé
1/P 1/Q
avec 1/P + 1/Q = 1, P = p/2, Q = p/(p − 2), a = ||x||2 /ϵ , b = (ϵ||x||∞ )1/Q , on obtient :
ϵ 1
|ϕ(x)| ≤ ||x||∞ + P/Q ||x||2 .
Q Pϵ
En incluant {(x, x), x ∈ (L∞ (Ω))} ⊂ L∞ (Ω) × L2 (Ω) avec norme ||(x, y)|| = Qϵ ||x||∞ + P ϵP/Q
1
||y||2
∞ 2 ∞ ′ 2
on étend par Hahn Banach ϕ à L (Ω) × L (Ω) donnant un élément de (ϕ1 , ϕ2 ) ∈ L (Ω) × L (Ω)
1 P/Q
avec ||ϕ1 || ≤ ϵ/Q, ||ϕ2 || ≤ (car en calculant la norme duale on a max(Q||ϕ1 ||/ϵ, P ϵ ||ϕ2 ||) ≤
P ϵP/Q
1
1) Donc ||ϕ|L (Ω) − J(ϕ2 )||(L (Ω)) = ||ϕ1 ||(L (Ω)) ≤ ϵ/Q et ϕ2 ∈ L (Ω). Or par le cas p = 1,
∞ ∞ ′ ∞ ′
(L1 (Ω))′′ = L∞ (Ω)′ et il contient L1 (Ω) comme espace fermé isométriquement via J (comme tout
espace de Banach est inclus isométriquement comme espace fermé dans son bidual). Comme le
(L1 (Ω))′′ 1
résultat précédent indique ϕ ∈ L2 (Ω) , on déduit ϕ ∈ J(L (Ω)) comme voulu. On a donc une
∞
fonction g telle que pour tout f ∈ L (Ω)
Z
ϕ(f ) = gf dµ
Ω
Soit donc g l'image dans L1 de ϕ (on revient au cas général p ∈]1, ∞[)Or dans le cas d'un espace
avec mesure nie, l'équation de la proposition D.1 donne : ||ϕ||(Lp )′ = sup{|ϕ(x)|, ||x||p ≤ 1, x ∈
L∞ } = sup{| gxdµ|, ||x||p ≤ 1, x ∈ L∞ } = ||g||q
R
q ∞
On déduit donc g ∈ L comme on voulait et ϕ = T (g) (en étendant la relation depuisL (Ω) par
p
densité dans L (Ω).
(3)cas 1<p<∞ et
µ σ -ni. p ′
Soit ϕ ∈ (L (Ω, µ)) , il faut montrer qu'elle vient d'un élément
q p p
de L (Ω, µ). On pose ϕn (f ) = ϕ(f 1An ) pour f ∈ L (An , µ) ⊂ L (Ω, µ). Par le cas précédent, il existe
q
gn ∈ L (An , µ) telle que Z
p
∀f ∈ L (An , µ), gn f dµ = ϕ(f 1An ).
||gn ||q = sup{|ϕ(f 1An )| ; ||f ||p ≤ 1, f ∈ L∞ (An , µ)} ≤ ||ϕ||(Lp )′ < ∞.
Or par unicité dans le cas (2) et vu les An n > m, gn 1Am = gm et donc |gn | est
croissant pour
croissant et g = sup |gn | ||g||q ≤ ||ϕ||(Lp )′ , vu |gn | ≤ |g| et comme
vérie par convergence monotone
gn → g p.s., on déduit par convergence dominée ||gn − g||q → 0 et en passant à la limite gn = g1An .
p
Or f 1An → f dans L et donc par continuité la relation ϕ(f 1An ) = T (g)(f 1An ) devient ϕ(f ) =
T (g)(f ) pour tout f ∈ Lp donc ϕ = T (g).
4 Convolution
Dans cette section, on considère l'espace mesuré (Ω, µ, T ) = (IRd , Leb, B) muni de la tribu bo-
p d p d
rélienne et de la mesure de Lebesgue. On note alors L (IR ) = L (IR , Leb, B). Vu l'accord avec
l'intégrale de Riemann, on note aussi dy = dLeb(y).
Théorème D.9 Soient f ∈ L (IR ), g ∈ L (IR ), 1 ≤ p ≤ ∞. Pour

. 1 d p d
presque tout x ∈ IR , y 7→ f (x − y)g(y) est dans L (IR ). La de f et g est la fonction

(dénissant la Convolution)
d 1 d
f ∗ g dénie par :
convolution
Z
(f ∗ g)(x) =
IR f (x − y)g(y)dy.
d
135
Alors f ∗ g ∈ L (IR ) et :
p d
||f ∗ g||p ≤ ||f ||1 ||g||p .
Démonstration. Si p = ∞, comme |g| ≤ ||g||∞ p.p., f (x − y)g(y) ≤ ||g||∞ |f (x − y)| d'où l'intégrabilité
et la borne souhaitée en intégrant (comme la mesure de Lebesgue est invariante par translation).
On suppose d'abord p = 1 et on utilise le Théorème de Fubini Tonelli pour calculer :
Z Z Z Z Z Z
dx|f |∗|g|(x) = dx dy|f (x−y)||g(y)| = dy dx|f (x−y)||g(y)| = ||f ||1 dy|g(y)| = ||f ||1 ||g||1 < ∞
On déduit du théorème de Fubini que pour presque tout x, y 7→ f (x − y)g(y) est intégrable et on
obtient la borne souhaitée
||f ∗ g||1 ≤ ||f ||1 ||g||1 .
p
Pour 1 < p < ∞, soit q l'exposant conjugué. Du cas p = 1 on déduit y 7→ |f (x − y)||g(y)| est
1 1/p
dans L donc y 7→ |f (x − y)| |g(y)| est dans L pour presque tout x. Or y 7→ |f (x − y)| ∈ Lq
p 1/q
1/p
donc par Hölder, y 7→ |f (x − y)||g(y)| = |f (x − y)| |g(y)|.|f (x − y)|1/q est dans L1 et
Z p Z
p p p/q
|(f ∗ g)(x)| ≤ |f (x − y)||g(y)|dy ≤ |f (x − y)||g(y)| dy ||f ||1 .
Par l'inégalité précédente du cas p = 1, on obtient donc en intégrant :
p/q p/q
||f ∗ g||pp ≤ ||f ||1 |||f | ∗ |g|p ||1 ≤ ||f ||1 ||g||pp ||f ||1 = ||f ||p1 ||g||pp .
Exercice . D.1 (cf TD) Soit f ∈ L1 , g ∈ Lp , h ∈ Lq , fˇ(x) = f (−x) Montrer que :
Z Z
(f ∗ g)h = g(fˇ ∗ h).
5 Support de la convolution
Si f continue, Supp(f ) = {x : f (x) ̸= 0}. Le résultat suivant permet d'étendre la dénition aux
fonctions mesurables.
Lemme D.10. Pour f : IR → IK mesurable, soit (ω ) la famille de tous les ouverts tels que, pour
d
chaque i, f = 0 p.p sur ω . Si ω = ∪ ω alors f = 0 p.p. sur ω. De sorte que ω est le plus grand
i i∈I
ouvert sur lequel f = 0 p.p.

i i∈I i
Démonstration. ω
Il faut écrire
comme union dénombrable car
c
I n'est pas forcément dénombrable.
Soit Kn = {x ∈ ω : ||x|| ≤ n, d(x, ω ) ≥ 1/n} comme la distance à un fermé est continue, on
n
voit que Kn fermé borné de IR (e.v.n de dimension nie) donc est compact et ω = ∪ K . Par
n∈IN n
compacité, Kn , recouvert par une union nie Kn ⊂ ωin,1 ∪ ... ∪ ωin,rn . donc ω = ∪ ω est
n∈IN,j≤rn i,j
union dénombrable d'ouvert sur lesquels f = 0 p.p. d'où le résultat.
Dénition D.2. f : IRd → IK mesurable, On pose Supp(f ) =

Soit IR
d
−ω où ω est le plus grand
p d
ouvert sur lequel f = 0 p.p. Si f ∈ L (IR ), on pose Supp(f ) = Supp(f1 ) pour n'importe quel
représentant f1 ∈ f de la classe d'égalité presque partout.
136
Proposition D.11. Si f ∈ L (IR ), g ∈ L (IR ) alors :
1 d p d
Supp(f ∗ g) ⊂ Supp(f ) + Supp(g).

Démonstration. On xex ∈ IRd avec y 7→ f (x − y)g(y) ∈ L1 . Si x ̸∈ Supp(f ) + Supp(g), on a
(x − Supp(f )) ∩ Supp(g) = ∅ donc en intégrant f ∗ g(x) = 0 sur Int((Supp(f ) + Supp(g))c ) =
(Supp(f ) + Supp(g))c . Donc f ∗ g est 0, p.p. sur cet ouvert de sorte qu'il est inclus dans Supp(f ∗
g)c .
6 Régularisation par convolution

On étudiera plus systématiquement au chapitre suivant certaines classes importantes de fonctions
d k
continues. Pour Ω ⊂ IR un ouvert. On note C (Ω) l'ensemble des fonctions k -fois diérentiables avec
k k d
leurs dérivées continues et Cc (Ω) les fonctions à support compact de C (Ω). Pour simplier si α ∈ IN ,
on note
∂ α1 ∂ αd
Dα f = · · · f.
∂xα1 1 ∂xαd d
On note |α| = |α1 | + ... + |αd |. On note
C ∞ (Ω) = ∩k∈IN C k (Ω), Cc∞ (Ω) = ∩k∈IN Cck (Ω).
Proposition D.12. Soit 1 ≤ p ≤ ∞. Si f ∈ Cck (IRd ), g ∈ Lp (IRd ), k ∈ IN ∪{∞} alors f ∗g ∈ C k (IRd )

et si |α| ≤ k : α α
D (f ∗ g) = D (f ) ∗ g.
De plus, si p < ∞, on a aussi la formule comprise comme intégrale de Riemann à valeur L (IR ), si p d
Supp(f) ⊂ [−C, C] : d
Z
f ∗g = dyf (y)τ−y g.
[−C,C]d
Démonstration. Par récurrence il sut du cas k = 1. On applique le théorème de dérivation avec

∂
condition de domination.
∂xi
f (x − y)g(y) = ( ∂x∂ i f )(x − y)g(y).
∂
Comme (
∂xi
f ) est à support compact et continue, il est borné par ||( ∂x∂ i f )||∞ et
∂ ∂
| f (x − y)g(y)| ≤ || f ||∞ 1K (x − y)g(y),
∂xi ∂xi
R
avec K le compact support de f . Or par Hölder 1B−K (y)|g|(y)dy ≤ Leb(B − K)1/q ||g||p , donc on
a une domination par une fonction intégrable c1B−K g si x ∈ B avec B compact. Le théorème de
d
dérivation 4.39 conclut donc. De plus, par changement de variables linéaire si Supp(f ) ⊂ [−C, C] ,
on a Z Z Z
f ∗ g(x) = d
f (x − y)g(y)dy = d
f (y)g(x − y)dy = f (y)(τ−y g)(x)dy
IR IR [−C,C]d
avec τh (g)(x) = g(x + h). On a vu à la proposition D.7 que y 7→ f (y)(τ−y g) est continue à valeur
Lp (IRd ) on peut donc parler de son intégrale de Riemann, sur [−C, C]d (calculée successivement
p d
variable par variable). On obtient une suite (de sommes de Riemann) qui converge dans L (IR ),
R
donc quitte à extraire une suite qui converge p.p. et donc p.p. la limite
[−C,C]d
dyf (y)(τ−y g) coïncide
R
avec l'intégrale de Riemann
[−C,C]d
dyf (y)(τ−y g)(x) par exemple si g est continue à support compact
137
et cette intégrale vaut l'intégrale de Lebesgue donc f ∗ g(x). On en déduit l'égalité voulue dans Lp
si g
continue à support compact. Or par densité, on a une suite de fonctions gn continues à support
p
compact convergeant dans L vers g . Et comme sup d ||τ−y gn − τ−y g||p → 0, f (.)(τ−. gn ) converge
IR
uniformément vers f (.)(τ−. g) et comme l'intégrale de Riemann est continue pour la convergence
R R
uniforme
[−C,C]d
dyf (y)(τ−y g) est la limite de [−C,C]d dyf (y)(τ−y gn ) dans Lp qu'on a déjà vu valoir
R
f ∗ gn , qui a pour limite f ∗g donc
[−C,C]d
dyf (y)(τ−y g) = f ∗ g.
7 Suites régularisantes et densité par convolution

Dénition D.3. Une suite régularisante est une suite de fonctions ρn ∈ Cc∞ (IRd ) avec
R
IR
d ρn = 1,
ρn ≥ 0 et Supp(ρn ) ⊂ B||.||2 (0, 1/n).
Exercice . D.2 Montrer que si ρn (x) = Cnd ρ(nx) avec C

R
ρ=1 et ρ(x) = 1{||x||2 <1} exp( ||x||12 −1 )
2
alors
d
ρn est une suite régularisante sur IR .
Lemme D.13. Soit ρ suite régularisante et f ∈ L (IR ) pour 1 ≤ p < ∞. Alors ||ρ
n
p d
n ∗ f − f ||p → 0 .
Démonstration. On a comme ||.||p est une norme on a par l'inégalité triangulaire (de l'intégrale de
Riemann et la proposition D.12) :
Z Z
||ρn ∗ f − f ||p = || dyρn (y)(τ−y f − f )||p ≤ dyρn (y)||τ−y f − f )||p
B(0,1/n)
Or si n assez grand, on a vu à la proposition D.7 que

R ||τ−y f − f )||p ≤ ϵ pour y ∈ B(0, 1/n) de sorte
que la dernière intégrale est bornée par ϵ B(0,1/n) dyρn (y) = ϵ.
Proposition D.14. Soit Ω ⊂ IR un ouvert, alors C

d ∞
c (Ω) est dense dans L (Ω) pour 1 ≤ p < ∞.
p
Démonstration. f ∈ Lp (Ω) et Kn = {x ∈ Ω : ||x||2 ≤ n, d(x, Ωc ) ≥ 1/n}. On a déjà remarqué

Soit
que Kn compact et ∪Kn = Ω donc f 1Kn → f p.p. et par la domination |f 1Kn − f | ≤ |f | on conclut
∞ d
par le TCD à ||f 1Kn − f ||p → 0. Soit m > n, si on considère ρm ∗ (f 1Kn ) ∈ C (IR ), on a par la
relation sur les supports des convolution,
Supp(ρm ∗ f 1Kn ) ⊂ Supp(ρm ) + Supp(f 1Kn ) ⊂ B(0, 1/m) + Kn ⊂ Ω
(vu que pour K, F compacts K + F est compact et en comparant les distances pour la dernière
∞ d
inclusion). Donc ρm ∗ (f 1Kn ) ∈ Cc (IR ). Mais on a vu ||ρm ∗ (f 1Kn ) − f 1Kn ||Lp (Ω) = ||ρm ∗ (f 1Kn ) −
f 1Kn ||p →m→∞ 0. Donc f 1Kn puis f sont dans l'adhérence de Cc∞ (Ω).
138
Annexe E
au chapitre 7
Le théorème des bases ne nécessite pas l'hypothèse I dénombrable ou H séparable, voici la version
générale.
Comme l'existence de base algébrique d'un espace vectoriel de dimension innie, elle requière un
lemme général de théorie des ensembles :
1 Rappel sur le lemme de Zorn

Si on était en dimension nie, on voudrait faire une récurrence sur le cardinal d'une famille
orthonormale en ajoutant un vecteur de plus pris dans un ensemble dense. Une façon de rédiger la
preuve est de considérer un sous-espace de dimension maximale et d'obtenir une contradiction en
construisant une famille libre de cardinal 1 de plus.
Dans le cas de la dimension innie on pourrait faire une récurrence transnie en complétant une
base de G en une base de E et mettant un bon ordre" sur la base. En analyse (ou en algèbre), on
préfère souvent utiliser la conséquence suivante de l'axiome du choix, le lemme de Zorn, qui utilise
une notion de maximalité pour obtenir une contradiction comme dans la preuve par induction.
Soit P muni d'un ordre partiel ≤. Q ⊂ P est dit totalement ordonné si tout a, b ∈ Q on a soit
a ≤ b, soit b ≤ a. c ∈ P est un si ∀a ∈ Q, a ≤ c.
majorant de Q
m ∈ P est un élément maximal de P si tout x ∈ P tel que m ≤ x on a x = m.
Enn P est dit inductif si tout ensemble totalement ordonné de P admet un majorant.
Lemme E.1. (de Zorn) Tout ensemble ordonné, inductif, non vide admet un élément maximal.
2 Théorème des bases dans le cas général
Théorème E.2. Soit H un espace préhilbertien.
1. Une famille orthonormale (x ) est libre et vérie l'inégalité de Bessel, pour tout x ∈ H :
i i∈I
X
|⟨x, xi ⟩|2 ≤ ||x||2
i∈I
139
2. De plus une famille orthonormale (e ) est une base hilbertienne si et seulement si on a
l'égalité de Bessel-Parseval :
i i∈I
X
|⟨x, xi ⟩|2 = ||x||2
i∈I
De plus, dans ce cas, pour tout x ∈ H , la série suivante converge (dans H mais pas absolument)
X
x= ei ⟨ei , x⟩.
i∈I
3. Si H est un espace de Hilbert, toute famille orthonormale peut être complétée en une base
hilbertienne de H et J : x 7→ (⟨x, e ⟩) établit alors une isométrie surjective J : H ≃ ℓ (I).
i i∈I
2
Remarque . E.1 De la formule pour x, on tire par continuité la formule pour le produit scalaire (qui
est série absolument convergente par Cauchy-Schwarz) :
X
⟨y, x⟩ = ⟨y, ei ⟩⟨ei , x⟩.
i∈I
Démonstration. (1) Si
P P
λi xi = 0, on calcule λj = ⟨xj , λi xi ⟩ = 0 donc xi est bien libre. Si F
est une partie nie de I , et V = VF = V ect(ei , i ∈ F ), on a déjà vu la formule pour la projection
orthogonale sur VF :
X
pV (x) = ei ⟨ei , x⟩.
i∈F
Donc par la propriété de contraction de pF et l'ortogonalité

X X X
||pF (x)||2 = ei ⟨ei , x⟩, ej ⟨ej , x⟩ = |⟨ei , x⟩|2 ≤ ||x||2
i∈F j∈F i∈F
la famille est donc sommable et on a l'inégalité de Bessel pour la somme (en passant au supremum)
2
et on trouve en particulier (⟨x, ei ⟩)i∈I ∈ ℓ (I).
(2) Si (ei )i∈I est une base soit xn ∈ V ect(ei , i ∈ I) convergeant vers x.
De plus, pour n assez grand |||x||2 − ||xn ||2 | ≤ ϵ/2 et pour tout J ,
|||pVJ (x)||2 − ||pVJ (xn )||2 | ≤ ||pVJ (xn − x)||(||xn || + ||x||) ≤ ||(xn − x)||(||xn || + ||x||) ≤ ϵ/2
d'où en prenant J tel que pVJ (xn ) = xn on obtient
X
|⟨ej , x⟩|2 − ||x||2 ≤ ϵ
i∈J
et donc la somme de la série est ||x|| d'où l'égalité de Parseval.

Réciproquement, Si on a égalité, on trouve Jn tel que
X
|⟨ej , x⟩|2 = ||pVJn (x)||2 → ||x||2
j∈Jn
et ceci implique par le théorème de Pythagore :
||pVJn (x) − x||22 = ||x||22 − ||pVJn (x)||22 → 0
140
donc tout élément de H est limite d'éléments de V ect(ei , i ∈ I) d'où la propriété de base hilbertienne.
De plus un calcul donne la formule pour x :
X X
||x − ei ⟨ei , x⟩||2 = |⟨ei , x⟩|2 → 0.
i∈F i̸∈F
(3) Considérons l'ensemble des familles orthonormales contenant une famille orthonormale don-
née, et ordonné par inclusion. C'est un ensemble non-vide. Si on a une famille totalement ordonnée
de familles orthonormales, l'union est un majorant, donc l'ensemble ordonné est inductif, il admet
donc par le lemme de Zorn un élément maximal (ei )i∈I . Si ce n'était pas une base (complétant la
famille orthonormale de départ), on aurait un x avec
X
|⟨x, ei ⟩|2 < ||x||2 .
i∈I
2
P P
Comme H est complet la somme y = i∈I e i ⟨e i , x⟩ converge car si (In ) croissante telle que i∈In |⟨ei , x⟩| →
2
P P
i∈I |⟨ei , x⟩| la suite yn = i∈In ei ⟨ei , x⟩ est de Cauchy car pour q > p
X X
||yp − yq ||22 = |⟨ei , x⟩|2 ≤ |⟨ei , x⟩|2 → 0.
i∈Iq −Ip i̸∈Ip
On déduit que y − x est orthogonal à tout ei car tout i tel que ⟨ei , x⟩ ̸= 0 est dans un In et que
⟨yn − x, ei ⟩ = 0 pourn assez grand pour un tel i. Donc par orthogonalité
X
||y − x||22 = ||x||2 − |⟨x, xi ⟩|2 > 0
i∈I
donc ajouter (y − x)/||y − x|| à la famille orthonormale contredit la maximalité et conclut.

Une fois l'existence d'une base, l'isométrie est évidente par le (2), et si on a une suite (λi )i∈I
2
P
dans ℓ (I), on voit que λi ei converge par complétude comme ci-dessus et on obtient ainsi la
surjectivité.
3 Correction de l'exercice sur les polynômes de Hermite

SoitH = L2 (IR, µ) l'espace de Hilbert réel des fonctions de carrés intégrables pour la mesure
1 −x2 /2
gaussienne standard µ(dx) = √ e dx, muni de la norme usuelle :
2π
sZ
e−x2 /2
||f ||2 = |f (x)|2 √ dx.
IR 2π
Soit n
x2 /2

ne d 2 /2
Hn (x) = (−1) √ (e−x )
n! dx
(et donc H0 (x) = 1)
1. Montrons par récurrence que pour n ≥ 1, Hn est un polynôme de la forme :
n−1
√ X
n!Hn (x) = xn + ak x k .
k=0
141
2 /2 2 /2
En eet H1 (x) = (−1)ex (−xe−x )=x et si on suppose l'hypothèse au rang n
√

p 2 d 2 /2
(n + 1)!Hn+1 (x) = −ex /2 (e−x n!Hn (x))
dx
2 /2 2 /2 2 /2
d
(e−x xk ) = −xk+1 e−x + kxk−1 e−x

Or donc l'hyp de rec donne
dx
n−1 n−1
p 2 d 2 /2
X X
(n + 1)!Hn+1 (x) = −ex /2 (e−x (xn + ak xk )) = (xn+1 −nxn−1 )+ ak (xk+1 −kxk−1 )
dx k=0 k=0
qui a la forme souhaitée.
2. Montrons que (Hn )n≥0 est une famille orthonormale de H.

On calcule pour m ≥ n :
Z m
1 d 2 /2
⟨Hn , Hm ⟩ = (−1) √ √ m
Hn (x) (e−x )dx
2π m! dx
En intégrant par partie
Z m m−1 Z m−1
d −x2 /2 d −x2 /2 d 2 /2
Hn (x) (e )dx = [Hn (x) (e )]∞
−∞ − Hn′ (x) (e−x )dx
dx dx dx
2 /2
le crochet est 0 vu que P (x)e−x pour P polynome tend vers 0 en ±∞.
Par induction si m>n
Z m−n+1
1 d 2 /2
⟨Hn , Hm ⟩ = (−1) m−n
√ √ Hn(n+1) (x) (e−x )dx = 0
2π m! dx
(n)
√
et si m= n vu Hn (x) = n! en appliquant le 1.
Z m−n Z
1 d −x2 /2 1 2 /2
⟨Hn , Hn ⟩ = (−1) m−n
√ √ Hn(n) (x) (e )dx = √ e−x dx = 1
2π m! dx 2π
comme voulue.
4 Théorème d'injectivité de la transformée de Fourier

Dénition E.1.
n
La fonction caractéristique (f.c. ou transformée de Fourier) du v.a. (X1 , ..., Xn ) :
Ω → IR est dénie par
Φ(X1 ,...,Xn ) (t1 , ..., tn ) = E[ei⟨t,X⟩ ],
Pn
pour tout t = (t1 , ..., tn ) ∈ IRn et en notant le produit scalaire ⟨t, X⟩ := i=1 ti Xi .
La fonction φX caractérise la loi de X par le théorème d'injectivité de la transformée de Fourier/

théorème d'inversion de la transformée de Fourier ci-dessous. On utilisera aussi plus tard au chapitre
2 la fonction caractéristique pour caractériser une notion de convergence, au chapitre 3 pour l'intro-
duction des vecteurs gaussiens qui seront la base du chapitre 5 sur le mouvement brownien. C'est
une notion FONDAMENTALE...
142
Lemme E.3. Soit X ∼ N (m, σ ) de loi normale alors Φ
2
X (t)
2 2
= exp(− t 2σ + imt).
Proof : On a vu une preuve à l'exercice 8 du TD 3 de MASS 31 utilisant que la partie imaginaire est
nulle par parité et le calcul de la partie réelle en établissant une équation diérentielle par intégration
dépendant d'un paramètre.
On donne ici une autre preuve par prolongement analytique. Par transfert, on doit montrer
(x−m)2 2 2
√1 eixt− 2σ2 = exp(− t 2σ + imt) en faisant le changement de variables u = (x − m)/σ
R
on se
σ 2π
ramène au cas σ = 1, m = 0.
En prenant m = z dans le calcul de la densité, on a pour z ∈ IR
Z ∞ Z ∞
1 − x2 +z2 −2xz 1 (x−z)2
dx √ e 2 = dx √ e− 2 = 1.
−∞ 2π −∞ 2π
Pour z ∈ C,
l en appliquant le résultat précédent
∞ Z N
1 |zx|n − x2 1 X |zx|n − x2 |z|2
Z Z
X 1 x2
dx √ e 2 = lim dx √ e 2 ≤ dx √ e− 2 +|zx| ≤ exp( )<∞
n=0 IR 2π n! N →∞ IR 2π n=0 n! IR 2π 2
La première bornitude permet d'appliquer le TCD pour les séries (ou Fubini pour la mesure discrète)
et intervertir somme et série :
∞
1 xn − x 2
Z Z
X 1 x2
z n
dx √ e 2 = dx √ e− 2 +zx
n=0 IR 2π n! IR 2π
2
la fonction de droite est donc la somme d'une série entière exp( z2 ) pour z ∈ IR, donc par identication
des coecients, elle vaut cette valeur pour tout z ∈ C,
l en particulier pour z = it et on trouve le
résultat.
On démontrera le théorème suivant dans la prochaine section puisque la preuve utilise des pro-
priétés générales de l'indépendance importante à noter pour elles-mêmes :
Théorème E.4 (Théorème d'injectivité de la transformation de Fourier). Deux v.a. (X1 , ..., Xn ), (Y1 , ..., Yn )
tels que
Φ (X1 ,...,Xn ) (t) = Φ(Y1 ,...,Yn ) (t)∀t ∈ IR n
sont égales en loi, c'est à dire :

P(X1 ,...,Xn ) = P(Y1 ,...,Yn ) .
De plus, si Φ ∈ L (IR , Leb) alors P

1 n
a une densité par rapport à la mesure de Lebesgue
donnée par (la transformée de Fourier inverse) qui est une fonction continue :
X (X1 ,...,Xn )
Z
1
f(X1 ,...,Xn ) (x) =
(2π)n IR n
Φ(X1 ,...,Xn ) (t)exp(−i⟨x, t⟩)dt.
4.1 Sommes de variables aléatoires indépendantes (Rappels)

Vous avez probablement vu en TD de théorie de la mesure la dénition de la convolution que l'on
rappelle ici et relie aux sommes de variables aléatoires indépendantes.
143
Dénition E.2 (Convolution). µ une mesure de Proba sur S ⊂ IRd et f : IR → IR une fonction
Soit
mesurable telle que pour tout x ∈ S , y 7→ f (x − y) est dans L1 (IRd , µ), la convolution de f et µ est
la fonction f ∗µ dénie par : Z
(f ∗ µ)(x) = d
f (x − y)dµ(y).
IR
Si µ est absolument continue par rapport à la mesure de Lebesgue de densité g, on note aussi f ∗ g.
Proposition E.5. Soient X, Y : Ω → IR des v.a. indépendantes :
d
1. ∀t ∈ IR , Φ (t) = Φ (t)Φ (t)

d
2. Si X , Y sont dans L (Ω), Cov(X + Y , X + Y ) = Cov(X , X ) + Cov(Y , Y ).

X+Y X Y
2
3. Si P (dx) = f (x)dx, P (dx) = g(y)dy alors P est absolument continue par rapport à
i i i i j j i j i j
Lebesgue (sur IR ) de densité f ∗ g dénie Lebesgue p.p. :

X Y X+Y
d
PX+Y (dz) = (f ∗ g)(z)dz.
4. Si seulement X est de loi absolument continue mais de densité continue bornée f , alors quel
que soit Y, P est absolument continue par rapport à Lebesgue (sur IR ) de densité f ∗ P d
(dénie partout). De plus, pour tout h continue bornée :

X+Y Y
E((h ∗ f )(Y )) = E(h(X + Y )).
Proof : 1. On a ΦX+Y (t) = E[eit(X+Y ) ] = E[eitX eitY ] = E[eitX ]E[eitY ] = ΦX (t)ΦY (t) l'avant dernière
itx
égalité par indépendance car f (x) = e est bornée donc intégrable (par rapport à une probabilité).
2. En général par bilinéarité Cov(Xi + Yi , Xj + Yj ) = Cov(Xi , Xj ) + Cov(Yi , Yj ) + Cov(Yi , Xj ) +
Cov(Yi , Xj ), mais ici par indépendance les deux derniers termes sont nuls.
3.Il faut d'abord vérier que f ∗ g est bien dénie. Par Fubini-Tonelli vu le caractère positif :
Z Z Z Z Z
n
dx n
dyf (x − y)g(y) = n
dy( n dxf (x − y))g(y) = n
dyg(y) = 1
IR IR IR IR IR
R
donc
IR
dyf (x − y)g(y) existe et est ni p.p.
n
En prenant h mesurable positive et en appliquant le transfert, on obtient par changement de

variables z = x + y dans l'intégrale sur y obtenue par Fubini :
Z Z Z
E(h(X + Y )) = 2d
h(x + y)f (x)dxPY (dy) = 2d
h(z)f (z − y)dzPY (dy) = d
h(z)(f ∗ PY )(z)dz
IR IR IR
ce qui donne le calcul de densité (égalité de la loi avec seulement le cas h = 1B ). Dans le cas de 4.
on raisonne pareil sauf que f x →
7 f (x −
continue bornée donne
R y) intégrable par rapport à la proba
PY directement. L'application de Fubini vient de IR2d |h(z)f (z − y)|dzPY (dy) ≤ ||h||∞ . L'égalité
R
intermédiaire donne aussi E(h(X + Y )) = d (h ∗ f )(y)PY (dy) = E((h ∗ f )(Y )) par transfert.
IR
4.2 Preuve [Facultative] du Thm d'injectivité de la transformée de Fourier

On va utiliser les lois gaussiennes pour se ramener au cas avec densité tout en exploitant leurs
propriétés de stabilité par cette transformée.
Lemme E.6. Soit g la densité sur IR d'un n-uplet de variable gaussienne i.i.d. N (0, σ ). Pour
n 2
tout h : IR → IR continue bornée, (h ∗ g )(x) → h(x). On a même convergence uniforme sur

σ
n
tout compact.
σ σ→0
144
En terme de convergence en loi, cela signiera au chapitre 2 que si (X1 (σ), ..., Xn (σ)) sont les
variables de densités gσ , alors x + (X1 (σ), ..., Xn (σ)) →σ→0 x en loi en utilisant la proposition E.5.(4)
au cas Y = x.
Proof : Par transfert et changement de variables
Z
(h ∗ gσ )(x) − h(x) = d
(h(x − σz) − h(x))g1 (z)dz.
IR
En prenant, en prenant le supremum sur un compact K :

Z
sup |(h ∗ gσ )(x) − h(x)| ≤ d
sup |(h(x − σz) − h(x))|g1 (z)dz
x∈K IR x∈K
la limite vient de la convergence dominée par une constante 2||h||∞ puisque une constante est inté-
grable par rapport à une probabilité comme g1 (z)dz , et la limite ponctuelle en z vient de la continuité
de h qui est donc uniformément continue sur K + B(0, |z|) et donc pour |σ| < 1, x − σz, x sont dans
d
ce compact de distance σ|z| tendant vers 0. Si h est uniformément continue sur IR on a même
d
convergence uniforme sur IR .
On a aussi besoin de la conséquence suivante du lemme de classe monotone :
Proposition E.7. Soient X, Y : Ω → IR des variables aléatoires. Les propriétés suivantes sont
n
équivalentes
1. X, Y sont égales en loi : P = P . R
2. Pour tout h : IR → IR, continue bornée, h(X)dP = R h(Y )dP
X Y
n
3. Pour tout ouvert O de IR , P (O) = P (O).

n
4. pour tout (x , ..., x ) ∈ IR :

X Y
n
1 n
PX (] − ∞, x1 ] × ...×] − ∞, xn ]) = PY (] − ∞, x1 ] × ...×] − ∞, xn ]).
La fonction FX (x1 , ..., xn ) = PX (] − ∞, x1 ] × ...×] − ∞, xn ]) appelée fonction de répartition

caractérise donc la loi.
Démonstration. Les produits d'intervalles ] − ∞, x1 ] × ...×] − ∞, xn ]

et les ouverts sont des familles
n
stables par intersection nie et engendrent la tribu des boréliens de IR (car par intersection et
n
complémentaire on obtient les boules carrées de la norme inni et que tout ouvert de IR est union
n n
dénombrable de telles boules, de centre un point de Q
l par densité de Q
l .) On applique donc le lemme
de classe monotone pour obtenir les 2 dernières équivalences. 1 implique 2 vient du th de transfert
d
R R
plus bas comme l'équivalence de 2 avec : Pour tout h : IR → IR, d h(x)dPX (x) = d h(x)dPY (x).
IR IR
c
Pour montrer 3 à partir de 2 et conclure, il sut de remarquer que hn (x) = max(1, nd(., O )) sont
c c
des fonctions continues bornées par 1 (car la distance à un fermé x 7→ d(x, O ) = inf{d(x, y), y ∈ O }
c
est continue, cf. MASS 31). Si x ∈ O , hn (x) = 0 et sinon, hn est une suite croissante qui tend vers
hn (x) → 1O (x) (car si x ∈ O, nd(., Oc ) → ∞ donc ≥ 1 pour n assez grand donc hn (x) = 1 pour n
R
assez grand). Donc par convergence monotone,
IR
d hn (x)dPX (x) → PX (O) d'où l'égalité du 3. par
celle du 2.
Preuve du Thm E.4 : Pour montrer l'injectivité, par le lemme E.7, il sut de montrer que l'égalité
des transformée de Fourier implique égalité de E(h(X)) pour tout h continue bornée.
145
Or par le lemme précédent, (h ∗ gσ )(x) → h(x) tout en étant borné par ||h||∞ donc par TCD :
E(h(X)) = lim E((h ∗ gσ )(X)) = lim E(h(X + Yσ ))

σ→0 σ→0
la dernière égalité avec Yσ de densité gσ et indépendant de X par la proposition E.5 (4) puisque la
densité gσ est continue bornée. Or la transformée de Fourier de X + Yσ est ΦX+Yσ (t) = ΦX (t)ΦYσ (t)
par la proposition E.5 (2) et donc
||t||22 σ 2
ΦX+Yσ (t) = ΦX (t)exp(− )
2
par le calcul du lemme E.3. Comme ceci est intégrable, on s'attend à avoir la formule d'inversion de
Fourier de la deuxième partie qui va donner E(h(X + Yσ )) en fonction de ΦX+Yσ (t), nous allons donc
la montrer à la main dans ce cas pour conclure la preuve.
Or en interprétant la densité comme une variante de la transformée de Fourier dans le cas gaus-
sien :
||x − y||22 ||v||2 y−x

Z Z
1 1
(gσ ∗PX )(x) = exp(− )PX (dy) = PX (dy)dv exp(− +i⟨ , v⟩))
IR
d
σ d (2π)d/2 2σ 2 IR
2d d
σ (2π) d 2 σ
soit par le changement de variables u = v/σ de jacobien σ −d on obtient
σ 2 ||v||2
Z Z
1
E(h(X + Yσ )) = dxh(x)(gσ ∗ P X )(x) = dxP X (dy)dvh(x) exp(− + i⟨y − x, v⟩))
IR
d
IR
3d
(2π)d 2
soit en appliquant Fubini sur les intégrales en y, v
σ 2 ||v||2
Z Z
h(x) h(x)
E(h(X+Yσ )) = dxdv exp(− −i⟨x, v⟩))ΦX (v) = dxdv exp(−i⟨x, v⟩))ΦX+Yσ (v)
IR
2d
(2π)d 2 IR
2d
(2π)d
qui est la formule souhaitée qui ne dépend bien que de la transformée de Fourier ΦX et conclut
l'injectivité.
Maintenant si ΦX est intégrable |h(x)ΦX+Yσ (v)| ≤ h(x)|ΦX (v)| est une domination (si h est à
support compacte) et puisque ΦX+Yσ (v) →σ→0 ΦX (v) par les formules précédentes, on obtient par le
TCD la formule souhaitée pour la densité à la limite. La continuité de la densité vient du Théorème
R
de continuité des intégrales à paramètres. On remarque qu'en utilisant
IR
d dxh(x)fX (x) E(h(X))) =
pour tout h positive continue à support compact, on déduit fX positive (sinon par continuité elle
est négative sur un ouvert dans lequel on peut prendre le support de h pour contredire positivité de
l'intégrale) et par convergence monotone et faisant tendre
R h → 1, on déduit fX intégrable et densité
de proba. D'où on peut utiliser E(h(X))) = IR
ddxh(x)f X (x) (maintenant valable pour h continue
bornée car fX peut servir de domination) pour identier PX (dx) = fX (x)dx en utilisant le lemme
E.7.
5 Théorème de Radon-Nikodym et Théorème de Dunford-

Pettis (Niveau M1-M2)
Ce complément pourrait pour l'essentiel être ajouté comme application du théorème de Riesz ou
p
du théorème de dualité des espaces L . Nous expliquons un théorème de théorie de la mesure qui
1
permet de dire quand une mesure provient d'une densité dans L (Ω, µ). On en déduit une application
à un théorème de compacité qui est utile pour la preuve du cas uniformément continue du théorème
1
de convergence des martingale dans L , le théorème de Dunford-Pettis E.9.
146
Dénition E.3. Si µ, ν sont des mesures de probabilités sur (Ω, T ), on dit que µ est absolument
continue par rapport à ν et on note µ≪ν si pour tout A ∈ T , ν(A) = 0 implique que µ(A) = 0
Dénition E.4. Si sont des mesures de probabilités sur (Ω, T ), on dit que µ admet une densité
µ, ν
1 dµ
h ∈ L (Ω, ν) par rapport à ν et on note h =
dν
, si h ≥ 0 p.s. et pour tout A ∈ T :
Z
1A hdν = µ(A).
Ω
Les dénitions s'étendent aux mesures σ -nies, mais on considère seulement ici le cas de proba-
bilités.
Théorème E.8 Pour toutes mesures de probabilités µ, ν sur (Ω, T ), il y a

.
équivalence entre µ ≪ ν et l'existence d'une densité h = ∈ L (Ω, ν) de µ par rapport à ν , et la
(de Radon-Nikodym)
dµ 1
densité est alors unique ν -p.s. dν
R
Proof : Si on a deux densités
R − k)dν = 0 pour tout A T mesurable, donc par la
Rh, k , Ω 1A (h
construction de l'intégrale aussi
Ω
f hdν = Ω f kdν d'abord pour f mesurable positive (par TCM)
1
puis pour f mesurable bornée donc par dualité h − k = 0 dans L (Ω, ν) donc ν -p.s.
R R
De plus, si on a existence d'une densité et si ν(A) = 0, par TCM, 1A h = limn→∞ 1 (h∧n) = 0
R Ω Ω A
1/2
car | 1 (h ∧ n)dν| ≤ ||(h ∧ n)∥|2 ||1A ||2 ≤ nν(A) = 0 par Cauchy-Schwartz. Donc µ(A) = 0 c'est
Ω A
à dire on a montré µ ≪ ν .
La partie dicile est l'existence d'une densité si µ ≪ ν . On va utiliser le théorème de représenta-
1
tion de Riesz (ou sa variante pour la dualité de L , le théorème D.8). Soit µα = µ + αν avec α > 0.
dµα dν 1
L'idée est simple on s'attend à avoir une densité
dν
= α + h strictement positive et donc dµ α
= α+h
2 α h
bornée par 1/α donc dans L ensuite α(1 − ) = α α+h →α→∞ h et on devrait pouvoir retrouver
α+h
h ainsi.
1
Appliquons cette idée, si f ∈ L (Ω, dµα ), on a
Z Z Z
1 1
|f |dν = |f |dαν ≤ |f |dµα
α α
1
R
Donc f ∈ L (Ω, dν) et f 7→ f dν dénit une forme linéaire continue sur L1 (Ω, dµα ), donc par le
∞ 1
théorème D.8, il existe hα ∈ L (Ω, dµα ) telle que pour tout f ∈ L (Ω, dµα ) on a
Z Z
f dν = f hα dµα .
R
Et de plus, on a ||hα ||L∞ (µα ) ≤ 1/α. Si f = 1{hα <0} , on obtient max(0, hα )dµα ≥ 0 donc vaut 0,
donc
1
ν({hα < 0}) ≤ µα ({hα < 0}) = 0
α
donc hα ≥ 0, ν p.s.
1
On montre maintenant la monotonie attendue pour hα (si on veut qu'elle soit égale à un
α+h
) Si
β > α, on a pour f positive bornée en utilisant µα (g) ≤ µβ (g) pour g positive ν -p.s,
Z Z Z Z
f hβ dµβ = f dν = f hα dµα ≤ f hα dµβ
carf hα posivite ν -p.s. par le résultat précédent, donc comme c'est valable pour tout f ≥ 0, on a
hβ ≤ hα µβ -p.s. donc ν -p.s.
147
Finalement, on a l'identité
Z Z Z Z Z Z
f dµ = f dµα − f αdν = f (1 − αhα )dµα = f α(1 − αhα )dν + f (1 − αhα )dµ.
Par ||hα ||L∞ (µα ) ≤ 1/α. on a 1 − αhα ≥ 0 µα -p.s. donc ν -p.s. En raisonnant comme avant on
obtient (1 − αhα ) ≥ (1 − βhβ ) ν -p.s. Donc, par l'égalité précédente (toujours pour f positive en
utilisant la croissance de α → αhα ν -p.s. par ce qu'on vient de voir donc µ-p.s. par l'hypothèse
µ ≪ ν) : Z Z Z Z
f α(1 − αhα )dν = f αhα dµ ≤ f βhβ dµ = f β(1 − βhβ )dν
soit α(1−αhα ) ≤ β(1−βhβ ), ν -p.s. donc converge vers un h en croissant et par convergence monotone
et l'égalité avant on obtient
Z Z Z Z Z
f hdν = lim f α(1 − αhα )dν = lim f dµ − f (1 − αhα )dµ ≤ f dµ.
α→∞ α→∞
Donc pour f =1 on trouve h ∈ L1 (Ω, dν). Or par la monotonie de la limite dénissant h, on a
α(1 − αhα ) h
(1 − αhα ) = ≤ →α→∞ 0
α α
ν -p.s. puisque h est ni ν -p.s. donc en utilisant encore l'hypothèse, aussi
R µ-p.s. Comme on a vu
la monotonie en α par convergence monotone, on déduit f (1 − αhα )dµ → 0 et donc nalement
l'égalité attendue qui conclut la preuve :
Z Z Z Z
f hdν = lim f dµ − f (1 − αhα )dµ = f dµ.
α→∞
On peut maintenant rappeler et prouver le théorème E.9 :
Théorème E.9 Soit une suite (X ) dans L (Ω, T , P ) avec T une tribu dénom-
. 1
brablement engendrée (donc T = T (E) avec E dénombrable, en particulier T = B(IR )). On a

(Dunford-Pettis) n
n
l'équivalence entre
1. (X ) est uniformément intégrable
2. (X ) admet une sous-suite (X ) ayant pour limite faible X ∈ L , c'est-à-dire :
n
1
n nk
∀f ∈ L∞ (Ω), E((Xnk − X)f ) → 0.
3. (X ) est bornée dans L et pour tout ϵ > 0, il existe η > 0 tel que si A ∈ T vérie P (A) ≤ η
1
alors pour tout n, E(1 |X |) ≤ ϵ.

n
A n
Proba-
C'est surtout l'équivalence entre 1. et 2. qui est dicile et porte le nom de théorème de Dunford-
bilités et Potentiel
Pettis. L'hypothèse dénombrablement engendrée" n'est pas nécessaire (cf. Delacherie-Meyer
Vol 1 p 27) mais nous la faisons pour simplier.
Proof : On commence par l'équivalence entre 1 et 3. Supposons 3. et xons ϵ > 0, η t.q. P (A) ≤ η
sup E(|Xn |)
n∈IN
implique E(1A |Xn |) ≤ ϵ. Par l'inégalité de Markov P (|Xn | ≥ c) ≤ c
≤ η dès que
sup E(|Xn |)
n∈IN
c≥ η
, en appliquant alors à A = {|Xn | ≥ c}, on déduit supn E(1{ |Xn | ≥ c}|Xn |) ≤ ϵ. Et
donc limc→∞ E(1{ |Xn | ≥ c}|Xn |) = 0 qui est l'uniforme intégrabilité recherchée.
148
Réciproquement, pour ϵ < 0 xé, on prend c > 0 tel que supn E(1{|Xn |≥c} |Xn |) ≤ ϵ/2, (en
particulier
E(|Xn |) = E(1{|Xn |≥c} |Xn |) + E(1{|Xn |<c} |Xn |) ≤ c + ϵ/2
donc Xn et bornée dans L1 , de sorte que
E(1A |Xn |) = E(1A 1{|Xn |≥c} |Xn |)+E(1A 1{|Xn |<c} |Xn |) ≤ E(1{|Xn |≥c} |Xn |)+E(1A 1{|Xn |<c} c) ≤ ϵ/2+P (A)c
qui est borné par ϵ P (A) ≤ η = ϵ/2c qui convient.

dès que
On suppose maintenant 3 et on montre 2. Si T = σ(An , n ∈ IN), A l'algèbre engendré par les An
c
c'est à dire les unions nis d'intersections nis de An , An (qui n'est en général pas une σ algèbres)
qui est stable par, complémentaire union nie et intersection nie. Il est facile de voir que A est
dénombrable.
En séparant les parties positives,négatives, on peut supposer Xn ≥ 0 et par extraction diagonale,
on trouve nk telle que E[Xnk 1A ] → µ(A) converge pour tout A ∈ A.
1
Il est facile de voir que µ(Ω) < ∞ vu que (Xn ) est bornée dans L (par 3.) µ est additive sur les
unions disjointes nies (par additivité de 1 7→ E[Xnk 1A ] qui est une mesure et passage à la limite).
De plus, par 3., soit ϵ positive, on a un η tel que P (A) ≤ η implique E[Xnk 1A ] ≤ ϵ donc µ(A) ≤ ϵ.
En particulier si P (A) = 0, on a µ(A) = 0.
Un résultat classique de théorie de la mesure dit que µ s'étend de façon unique sur σ(A) en une
∗
mesure µ (cf. par exemple Barbe-Ledoux Th 1.49). Il est facile de voir que l'on a encore si P (A) = 0,
∗ ∗ 1
on a µ (A) = 0. Donc, µ ≪ P et par le théorème de Radom-Nikodym, il existe X ∈ L telle que
E(X1A ) = µ(A) = limn→i nf ty E[Xnk 1A ]. Il en est donc de même pour toute fonction étagée fm (resp.
gm ) d'une suite décroissante (resp. croissante) convergeant vers f mesurable positive bornée
D'où on a les deux inégalités donnant l'égalité
lim sup E[Xnk f ] ≤ lim E[Xnk fm ] = E(Xfm ) → E(Xf )

n→∞ n→∞
lim inf E[Xnk f ] ≥ lim E[Xnk gm ] = E(Xgm ) → E(Xf ).

n→∞ n→∞
On a donc obtenu 2.
On laisse en exercice l'implication de 3. vers 1. que l'on n'a pas utilisé dans le cours.
149

CoursTopoMesure-2024

Transféré par

Informations du documentcliquez pour développer les informations du documentCours Topologie et Mesures

Informations du documentcliquez pour développer les informations du document

Droits d'auteur :

Formats disponibles

CoursTopoMesure-2024

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

CoursTopoMesure-2024

Transféré par

Droits d'auteur :

Formats disponibles

Cours au S5 du parcours Mathématiques et économie :

Topologie et Théorie de la mesure.

1 Ensembles dénombrables et Familles sommables 5

2 Introduction à la Topologie des Espaces Métriques 17

3 Ensembles et fonctions convexes, Introduction à l'optimisation 38

4 Intégration de Lesbesgue : Construction de l'intégrale et grands théorèmes 49

6 Introduction aux espaces Lp 80

7 Espaces de Hilbert ; bases hilbertiennes 88

A Compléments facultatifs au chapitre 2 : Topologie des espaces métriques 102

B Compléments facultatifs et hors programme au chapitre 3 : Ensembles et fonctions

D Compléments facultatifs et hors programme au chapitre 6 : Espaces Lp 129

E Compléments facultatifs et hors programme au chapitre 7 139

Ensembles dénombrables et Familles

en conservant les propriétés de commutativité et d'associativité des sommes nies.

1 Ensembles (au plus) dénombrables

des applications de Ω dans {0, 1}).

Rappel .1.1 Si A et B sont deux parties de Ω (i.e. deux éléments de P(Ω)).

et la diérence symétrique A∆B = (A − B) ∪ (B − A). On remarquera la relation de ces

3. Plus généralement on dénit l'union d'une famille Ai ∈ P(Ω), i ∈ I :

et de l'intersection d'une même famille :

qui vérie les relations de distributivités :

et (de façon équivalente) des intersections :

f −1 (A) = {ω ∈ Ω : f (ω) ∈ A}.

Un ensemble A qui n'est pas ni est dit inni.

1.2 Ensembles innis dénombrables

On va utiliser librement le lemme suivant :

Lemme 1.2. 1. Toute partie non-vide de IN a un minimum.

Proposition 1.4. Un ensemble P est au plus dénombrable si et seulement si il existe un surjection

2. Un ensemble X est au plus dénombrable si et seulement si il admet une de

Proposition 1.6. Les ensembles IN , k ∈ IN ; ZZ et Ql sont innis dénombrables.

Enn, on améliore le lemme précédent.

Les ensembles au plus dénombrables serviront de base aux probabilités discrètes.

1.3 Ensembles innis non dénombrables

Théorème 1.9. [0, 1] et IR ne sont pas dénombrables.

2 Familles sommables à termes positifs

Démonstration. En voyant σ comme produit de transpositions, il sut de montrer le résultat pour

n j−1 k−1 n j−1 k−1 n n

Corollaire 1.10. Si E est ni et e : [[1, n]] → E une bijection, f : E → Cl alors P n

Le résultat suivant résume les propriétés de manipulation de ces sommes :

Proposition 1.11. 1. Si E ni, on a

En particulier, on a Card(E) = P Card(E ).

En particulier, on a Card(E × F ) = Card(E)Card(F ).

e∈E 1 = i=1 1 = n par dénition.

2.2 Dénition et premières propriétés

est bornée et alors on a X

2. (lemmePde domination) Si a ≤ b pour tout i et (b ) sommable, alors (a ) est sommable et

3. (lemme de permutation) Si (a ) est sommable et σ : I → I est une bijection, alors (a )

est sommable de même somme.

2.3 Sommation par paquet et applications

1. pour chaque λ ∈ Λ, (a ) est sommable, disons de somme σ

Dans tous les cas (même en l'absence de sommabilité), on a l'égalité :

Donc en passant successivement au sup sur les Jk ni, on obtient :

1. pour tout i ∈ I , (a ) est sommable et la famille des sommes ( P a ) est sommable

Dans tous les cas (même en l'absence de sommabilité), on a l'égalité :

Comme chaque terme de la somme ne dépend que de n = i + j + 1, on a envie de considérer la

3 Familles sommables à termes scalaires

On a le résultat qui résume les propriétés élémentaires :

Proposition 1.18. 1. Une famille (z ) est sommable si et seulement si (Re z ) et (Im z )

en conservant les propriétés de commutativité et d'associativité des sommes nies.

et la diérence symétrique A∆B = (A − B) ∪ (B − A). On remarquera la relation de ces

3. Plus généralement on dénit l'union d'une famille Ai ∈ P(Ω), i ∈ I :

qui vérie les relations de distributivités :

Un ensemble A qui n'est pas ni est dit inni.

1.2 Ensembles innis dénombrables

Proposition 1.6. Les ensembles IN , k ∈ IN ; ZZ et Ql sont innis dénombrables.

Enn, on améliore le lemme précédent.

1.3 Ensembles innis non dénombrables

Démonstration. En voyant σ comme produit de transpositions, il sut de montrer le résultat pour

Corollaire 1.10. Si E est ni et e : [[1, n]] → E une bijection, f : E → Cl alors P n

Proposition 1.11. 1. Si E ni, on a

e∈E 1 = i=1 1 = n par dénition.

2.2 Dénition et premières propriétés

Donc en passant successivement au sup sur les Jk ni, on obtient :

Exemple .2.4 Si Z =X ×Y avec (X, dX ), (Y, dY ) des em. On dénit :

Dénition 2.8. valeur d'adhérence

Alors f admet un unique point xe.

Dénition 2.13. Soit F ⊂ X. On dit que F est un fermé de X si Fc est un ouvert de X.

Remarque . 2.5 D'après la dénition, Fr(A) = Fr(Ac ) = Ā ∩ Ac est un fermé.

Dénition 2.17. Soient A ⊂ X, Y des em f :A→Y.

Dénition 2.19. Une application f :X→Y est uniformément continue si :