Mathematics">
CoursTopoMesure-2024
CoursTopoMesure-2024
CoursTopoMesure-2024
Yoann Dabrowski
7 octobre 2024
Table des matières
1
11.1 Complément : un résultat reliant complétude et compacité (facultatif ) . . . . . 34
11.2 Complément : Compacité topologique (facultatif ) . . . . . . . . . . . . . . . . 34
12 Intégrale de Riemann à valeur Espace de Banach . . . . . . . . . . . . . . . . . . . . 34
12.1 Rappel sur les Intégrales impropres . . . . . . . . . . . . . . . . . . . . . . . . 36
12.2 Exemples de référence (à connaître TRES BIEN) . . . . . . . . . . . . . . . . 36
12.3 Théorèmes de comparaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
13 Espaces métriques séparables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2
5 Intégration avancée : Théorème de Fubini, Changements de variables 71
1 Mesure produit et théorèmes de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . 71
1.1 Tribus produits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
1.2 Mesure produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
1.3 Théorème de Fubini-Tonelli et Fubini (admis) . . . . . . . . . . . . . . . . . . 73
2 Une Inégalité de convexité : l'Inégalité de Jensen . . . . . . . . . . . . . . . . . . . . . 74
3 Théorème de changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.1 Cas ane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2 Rappel (de L2) sur les diéomorphismes . . . . . . . . . . . . . . . . . . . . . 76
3.3 Cas général (admis) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3
C Compléments facultatifs au chapitre 4 : Espaces mesurés. 121
1 Lemme de classe monotone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
1.1 Dénitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
1.2 Le résultat principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
1.3 Preuve du corollaire 4.19 au lemme de classe monotone sur l'unicité des mesures
sigma-nie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
2 Compléments sur les Boréliens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
2.1 Espaces métriques séparables et leurs boréliens . . . . . . . . . . . . . . . . . . 123
2.2 Compléments : Théorème d'approximation de Weierstrass . . . . . . . . . . . . 125
2.3 Preuve du lemme 4.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
3 Stabilité des fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4 Compléments sur la construction de l'intégrale . . . . . . . . . . . . . . . . . . . . . . 126
4.1 Intégrale des fonctions étagées . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.2 Preuve du lemme 4.20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.3 Preuve du lemme 4.22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4
Chapitre 1
sommables
Un espace de probabilité discret (disons dénombrable) associe des nombres, les probabilités aux
évènements de base {ωi }, correspondant aux éléments ωi de l'espace des réalisations et en sommant
à des évènements plus compliqués. Comme ces nombres vont être associés à des ensembles, l'ordre
de sommation de ces nombres ne doit pas importer. On va donc étudier une notion de sommation de
série où l'ordre de sommation n'importe pas. Le but est donc pour une famille de nombres (ui )i∈I ,
indicée par un ensemble inni I (le plus souvent dénombrable) de dénir la somme :
X
ui ,
i∈I
On a admis en L1 l'existence de l'ensemble IN des entiers naturels et d'un ensemble constitué des
parties de Ω (ce sont des axiomes de base de la théorie des ensembles).
Dénition 1.2. L'ensemble des parties de Ω est noté P(Ω). Une famille F de parties de Ω est une
partie de P(Ω) (soit F ⊂ P(Ω) ou F ∈ P(P(Ω)). Les éléments de F sont des parties de Ω.
Lemme 1.1. La fonction indicatrice A 7→ 1 réalise une bijection entre P(Ω) et {0, 1} (l'ensemble Ω
5
Démonstration. L'inverse est h 7→ h−1 ({1}). La vérication que c'est bien un inverse est facile, et
laissée en exercice.
et plus généralement [ [ [
Ai ∩ Cj = (Ai ∩ Cj ).
i∈I j∈J i∈I,j∈J
\ \ \
Ai ∪ Cj = (Ai ∪ Cj ).
i∈I j∈J i∈I,j∈J
4. A et B sont disjoints si A ∩ B = ∅.
5. On a les relations fondamentales du complémentaire (Ac )c = A et pour le complémentaire des
unions [ c \
Ai = Aci
i∈I i∈I
Rappel .1.2 Soit A⊂E et f : Ω → E, on rappelle que l'image réciproque f −1 (A) est dénie par :
On a vu en L1 les relations
f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B),
6
f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B),
f −1 (Ac ) = [f −1 (A)]c ,
[ [
f −1 Ai = f −1 (Ai ), (1.1)
i∈I i∈I
\ \
−1
f Ai = f −1 (Ai ).
i∈I i∈I
Remarque . 1.3 Certains auteurs disent dénombrable pour ce que nous appelons au plus dénombrable
et inni dénombrable avec le sens de dénombrable ci-dessus.
On peut représenter les éléments d'un ensemble dénombrable A à l'aide d'une suite innie en
écrivant A = {xn ; n ≥ 1} (x est l'inverse de la bijection f ).
Proposition 1.3. Les ensembles au plus dénombrables sont soit nis, soit dénombrables. De plus,
pour une partie innie P ⊂ IN, il existe une bijection strictement croissante et une seule de IN → P .
Démonstration. Les ensembles au plus dénombrables sont par dénition en bijection avec les parties
de IN. Dans le cas inni, il sut de voir le second point pour obtenir la bijection avec IN. On dénit
∗
par récurrence la bijection f : IN → P . Plus précisément, on construit par récurrence sur n une
application strictement croissante fn : [[1, n]] → P telle que pour tout x ∈ Im(fn ), y ∈ P − Im(fn ),
x < y et fn |[[1,k]] = fk . Comme P , inni, il est non-vide donc admet un élément a0 = min(P ) On pose
f0 (0) = a0 d'où l'initialisation.
On suppose construit fn , et on prend an+1 = min(P − Im(fn )) qui existe car cette partie est
innie de IN donc non vide (si elle n'était pas innie, P serait nie comme union nie de parties
nies). On pose fn+1 (k) = fn (k), k ≤ n, fn+1 (n + 1) = an+1 de sorte que par l'hyp de rec sur fn ,
an+1 > fn (k), k ≤ n ce qui donne la stricte croissance de fn+1 en combinant avec celle de fn . Enn,
si y ∈ P − Im(fn+1 ) ⊂ P − Im(fn ) on a par hyp de rec y > fn (k)k ≤ n et y > an+1 car c'est le min
donc ≥ et on a y ̸= an+1 par construction. Donc la relation demandée à l'étape suivante est vériée.
7
On obtient f strictement croissante donc injective en rassemblant les valeurs des fn qui s'accordent
(f (n) = fn (n) = fm (n), m ≥ n).
Pour voir que f bijective, par l'absurde, sinon il existe b ∈ P − Im(f ) mais par stricte croissance
d'entiers f (n) → ∞ donc il existe n minimal tel que b < f (n) = fn (n) ce qui impose par minimalité
b > f (n − 1) et contredit fn (n) = M in(P − Im(fn−1 )) vu b ∈ P − Im(fn−1 ).
−1
Pour l'unicité, si g est une autre telle bijection g ◦ f est une bijection strictement croissante de
−1
IN → IN ainsi que sa réciproque et le lemme 1.2 donne donc g ◦ f (n) ≥ n, f −1 ◦ g(n) ≥ n et donc,
d'où par croissance de g, f appliquée encore à ces relations : f = g .
On va obtenir des exemples d'ensembles dénombrables les plus courants. Pour cela on a besoin
de quelques méthodes de constructions.
Lemme 1.5. 1. La réunion d'une suite (X ) d'ensembles nis 2 à 2 disjoints est au plus
dénombrable.
n n≥0
3. Le produit cartésien d'un nombre ni d'ensembles au plus dénombrables est au plus dénom-
brable.
Démonstration. a = Card(X )
1. Soit n A =n
P
et
n
a A = 0
k=0 k ( −1
n
∗
h :
). On a des bijections n
[[An−1 + 1, An ]] → [[1, an ]] → Xn qui induisent une application h : IN → ∪n Xn dès qu'un nombre
inni de Xi n'est pas vide, ou h : [[1, Ap ]] → ∪n Xn qui est par construction surjective. L'injectivité
des hn et le fait que les Xn sont disjoints donne l'injectivité de h. 2. Si X est ni on prend la suite
constante, sinon, pour une bijection h : IN → X on prend Xn = h([[0, n]]) comme suite croissante
cherchée. Réciproquement, la suite croissante Xn donne une suite disjointe X0 , Xn+1 − Xn de parties
nies, donc 1 donne que l'union est au plus dénombrable.
3. Une récurrence triviale ramène au cas du produit de 2 ensembles A, B . Soit h : IN → A,
2
g : IN → Bdes surjections données par la proposition 1.4. f = h × g : IN → A × B est une surjection
2 2
qui ramène au cas IN qui admet pour suite exhaustive d'ensembles nis [[0, n]] .
Démonstration. k
On a vu le cas du produit IN au lemme précédent. [[−n, n]] est une suite exhaustive
d'ensemble ni pour ZZ qui est donc au plus dénombrable par la proposition précédente, il est inni
∗
car il contient IN. Enn (p, q) 7→ p/q est une surjection de ZZ × IN → Q,
l donc par la proposition 1.4
Q
l est au plus dénombrable, et inni car contient IN.
Proposition 1.7. Une réunion au plus dénombrable d'ensembles au plus dénombrables est au plus
dénombrable.
8
Démonstration. Soit (Xn )n≥0 une suite d'ensembles dénombrables (si la suite est nie, on peut la
prolonger en une suite innie. Petite subtilité, passé d'une famille dénombrable à une suite d'ensemble
n'est pas complètement anodin et utilise l'axiome du choix dénombrable). Soit fn : IN → Xn une
2 S
surjection donnée par la proposition 1.4. On pose f : IN → Xn déni par f (n, p) = fn (p) et en
n∈IN
2
composant avec une surjection IN → IN , on obtient le résultat par la réciproque dans la proposition
juste citée.
Lemme 1.8. (Théorème de Cantor) Il n'existe pas de surjection h : E → P(E) entre un ensemble
E et l'ensemble de ses parties.
Démonstration. h : E → P(E)
En eet une application A = {x ∈
permet de considérer l'ensemble
E : x ̸∈ h(x)}. Il n'existe pas de y tel que h(y) = A car par l'absurde, si il existait, soit y ∈ A et
alors y ̸∈ h(y) = A une contradiction, soit y ̸∈ A et alors y ∈ h(y) = A encore une contradiction.
Remarque . 1.4 En conséquence de ce lemme et de la proposition 1.4, P(IN) n'est pas dénombrable
(il est inni à cause de l'injection x 7→ {x} déni sur IN), car sinon on aurait une surjection de
IN → P(IN). En conséquence {0, 1}IN , en bijection avec la fonction indicatrice n'est pas non-plus
dénombrable.
Démonstration. On construit une injection φ : {0, 1}IN → [0, 1] (le cas IR s'en déduit. (l'image de
cette injection va être l'ensemble triadique de Cantor). On xe a = (an ) ∈ {0, 1}IN on dénit une
suite de segments emboîtés, on pose J0 = [0, 1] et si Jn = [xn , yn ] alors on découpe l'intervalle en
trois en posant un = (2xn + yn )/3 et vn = (xn + 2yn )/3. Si an = 0, on pose Jn+1 = [xn , un ], et si
an = 1, on pose Jn+1 = [vn , yn ]. On obtient par construction une suite de segments emboîtés, xn , yn
n
sont des suites adjacentes et yn − xn ≤ 1/3 (récurrence facile) donc l'intersection est un singleton
∩n Jn = {φ(a)}.
′
Pour voir que φ est injective on note que si a ̸= a sont deux suites et n le premier indice avec
an ̸= a′n , alors Jn ∩ Jn′ = ∅ et les images sont donc distinctes.
Remarque . 1.5 L'ensemble triadique de Cantor a plein de propriétés intéressantes. Topologiquement,
il est fermé, totalement disconnecté (les composantes connexes sont les singletons). Il est de longueur
nulle (car inclus dans l'union sur tous les cas possibles des Jn dont la longueur perd un facteur 2/3
à chaque n). Le sens de cette longueur sera vu au chapitre 3 (c'est la mesure de Lebesgue). Il est
en fait fractal de dimension de Hausdor ln(2)/ ln(3) < 1 (ce qui réexplique la longueur nulle, mais
c'est un sujet beaucoup plus avancé des mesures intermédiaires entre discret et continue).
9
Exemple . 1.1 L'ensemble des nombres irrationnels IR −Q
l est non-dénombrable, car sinon son union
avec Q
l à savoir IR serait dénombrable, ce qui n'est pas le cas.
n
X n
X
ai = aσ(i) .
i=1 i=1
f (e) = f (ei ).
e∈E i=1
Démonstration.
′
Si on prend une autre bijection e′ on considère la bijection σ = e−1 ◦ e′ de sorte que
e◦σ =e. La formule de commutativité de la somme conclut :
n
X n
X n
X
f (ei ) = f (eσ(i) ) = f (e′i ).
i=1 i=1 i=1
10
2. (Sommation par paquet) Si E ni est une union disjointe nie E = S Ei (c'est à dire I
ni et E ∩ E = ∅ si i ̸= j) et f : E → Cl alors :
i j
i∈I
X XX
f (e) = f (e).
e∈E i∈I e∈Ei
XX X XX
ae,f = ae,f = ae,f .
e∈E f ∈F (e,f )∈E×F f ∈F e∈E
X Nm
X
f (e) = f (g(k))
e∈E k=1
N1
X N2
X Nm
X
= f (g(k)) + f (g(k)) + · · · + f (g(k))
k=1 k=N1 +1 k=Nm−1 +1
m
X Nl
X
= f (g(k))
l=1 k=Nl−1 +1
m
X Nl
X
= f (gl (k))
l=1 k=Nl−1 +1
m
X X
= f (e)
l=1 e∈Ej(l)
XX
= f (e)
i∈I e∈Ei
Le résultat sur le cardinal est une application du 1. et de la sommation par paquet pour la fonction
f =1 constante :
X XX X
Card(E) = 1= 1= Card(Ei ).
e∈E i∈I e∈Ei i∈I
11
3. Il sut d'appliquer la sommation par paquet aux unions disjointes
E × F = ∪e∈E {e} × F = ∪f ∈F E × {f }.
Pour le cardinal on a par le 1 et la distributivité de la multiplication par rapport à l'addition :
X XX X X
Card(E × F ) = 1= 1= Card(F ) = Card(F ) 1 = Card(E)Card(F ).
(e,f )∈E×F e∈E f ∈F e∈E e∈E
et alors on note ( )
X X
ai = sup aj : J ⊂ I, fini .
i∈I j∈J
Tout d'abord, le résultat simple suivant ramène au cas I dénombrable, ce que l'on supposera par
la suite :
Lemme 1.12. Si (a ) est une famille sommable, alors le support I = {i ∈ I : ai ̸= 0} est au plus
dénombrable.
i i∈I 0
Démonstration. En eet si S =
P
i∈I ai et si In = {i ∈ I : ai ≥ S/n}, alors I0 = ∪n≥1 In est
au plus dénombrable comme union d'une suite d'ensembles nis car Card(In ) ≤ n. En eet, si
P
j ∈ In , aj ≥ S/n donc si J ⊂ In ni S ≥ j∈Jn aj ≥ SCard(J)/n donc Card(J) ≤ n et donc
Card(In ) ≤ n.
On résume les propriétés générales dans l'énoncé suivant :
Proposition 1.13. 1. (critère des suites exhaustives) Si (J ) est une suite exhaustive de
parties nies de I , alors la famille (a ) est sommable si et seulement si la suite (P a )
n n≥0
Démonstration. 1/ La famille
P
a
i∈Jn i étant inclus dans la famille des sommes nies, il est clair
qu'elle est majorée si la famille est sommable (et on a en passant au sup la partie ≥ de l'égalité
énoncée). Mais réciproquement toute famille nie est inclus dans un certain Jn , par dénition d'une
suite exhaustive, d'où la borne inverse et la réciproque.
P P
2/ Il sut de borner les sommes partielles nies
P ai
i∈JP ≤ bi P
i∈Jet passer au sup.
3/ Pour tout J ni, σ(J) est ni donc i∈J aσ(i) = i∈σ(J) ai ≤ i∈I ai . D'où la sommabilité
−1
et la première inégalité en passant au sup. En considérant la bijection réciproque σ on obtient de
même l'autre inégalité.
12
Le dernier résultat généralise la commutativité des sommes.
Corollaire 1.14. Une famille à termes positifs (a ) IN est sommable si et seulement si la série
n n∈
est convergente.
∞
X
an
n=0
!
X X X X
ai = σλ ≡ ai .
i∈I λ∈Λ λ∈Λ i∈Iλ
Démonstration. Commençons par la condition nécessaire. Si (ai )i∈I est sommable alors les sommes
nies d'une sous famille (ai )i∈Iλ sont
Pbornées par les sommes de la famille totale donc on a la première
condition de sommabilité et σλ ≤ i∈I ai . Plus si on a des sous ensembles nis J1 ⊂ Iλ1 , ..., Jn ⊂ Iλn
n
pour des λj distincts, ils sont disjoints et leur union J = ∪k=1 Jk est un sous-ensemble ni de I donc
n X
X X X
ai = ai ≤ ai
k=1 i∈Jk i∈J i∈I
n
X X
σλk ≤ ai .
k=1 i∈I
Donc la famille (σλ )λ∈Λ est sommable et on obtient la première inégalité ≥ en passant au sup.
Réciproquement, pour tout J partie nie de I on dénit Jλ = J ∩ Iλ et on obtient un nombre ni
n
de λ tel que J = ∪k=1 Jλk . On déduit
X n X
X n
X X
ai = ai ≤ σλk ≤ σλ .
i∈J k=1 i∈Jk k=1 λ∈Λ
D'où la bornitude sur J qui donne la sommabilité, et l'autre inégalité en passant au sup.
Un cas particulier est la "version famille sommable" du théorème de Fubini (qui se généralise à
un théorème d'intégration). Le cas positif est nommé théorème de Fubini-Tonelli. Il correspond à la
décomposition
I × J = ∪i∈I {i} × J = ∪j∈J I × {j}.
Il donne un résultat d'interversion des sommes.
13
Théorème 1.16. (de Fubini-Tonelli) Une famille double (a ) à termes positifs est sommable
si et seulement si on a l'une des deux propriétés équivalentes suivantes :P
i,j i∈I,j∈J
! !
X X X X X
ai,j = ai,j = ai,j .
(i,j)∈I×J i∈I j∈J j∈J i∈I
Démonstration. C'est une application directe du résultat de sommation par paquets avec les parti-
tions ci-dessus.
Exemple .
∞ X
∞
X 1
1.2 Calculons la somme I= .
i=0 j=0
(i + j + 1)2
Comme c'est une série à coecient positifs, chaque somme est somme d'une famille sommable,
donc par Fubini-Tonelli, on obtient une somme sur le produit :
X X 1 X 1
I= = .
(i + j + 1)2 2
(i + j + 1)2
i∈IN j∈IN (i,j)∈IN
Dénition 1.5. (zi )i∈I de nombres complexes ou réels est dite sommable si la famille
Une famille
1
(|zi |)i∈I est sommable. On note ℓ (I, IK) l'ensemble des familles sommables d'éléments de IK indexées
par I .
On note X
||z||1 = |zi |.
i∈I
14
Lemme 1.17. ℓ1 (I, IK) est un espace vectoriel et de plus on a pour u, v ∈ ℓ1 (I, IK), µ, ν ∈ IK :
||λu + µv||1 ≤ |λ|||u||1 + |µ|||v||1 .
Démonstration. I
On voit que c'est un sous-espace vectoriel de l'ensemble des fonctions IK . D'abord,
la famille nulle est sommable et de plus si λ, µ ∈ IK, (ai ), (bi ) des familles sommables, pour J ni, on
a par l'inégalité triangulaire (des nombres) :
X X X X
|λai + µbi | ≤ |λ||ai | + |µ||bi | = |λ| |ai | + |µ| |bi | ≤ |λ|||a||1 + |µ|||b||1
i∈J i∈J i∈J i∈J
1
donc comme la valeur est bornée, on obtient, la sommabilité de la famille donc ℓ (I, IK) (λai + µbi ),
I
est stable par combinaison linéaire et est donc un sous-espace vectoriel de IK , puisqu'il contient aussi
la famille nulle (0).
De plus en passant au sup sur J on obtient ||λa + µb||1 ≤ |λ|||a||1 + |µ|||b||1 .
Comme d'habitude pour dénir l'intégrale (ici on va dénir de même la somme), on sépare les
parties positives, négatives des parties réelles et imaginaires, pour dénir la somme. On note donc
(ai )+ = max(ai , 0), (ai )− = max(−ai , 0) de sorte que zj = (Re zj )+ − (Re zj )− + i(Im zj )+ − i(Im zj )−
Comme (Re zj )+ + (Re zj )− , (Im zj )+ + (Im zj )− ≤ |zj | on déduit que si (zj ) est sommable, alors
((Re zj )+ ), ((Re zj )− , ((Im zj )+ ), ((Im zj )− ) le sont aussi par domination.
Dénition 1.6. La somme d'une famille sommable (zi )i∈I est la valeur :
X X X X X
zj := (Re zj )+ − (Re zj )− + i (Im zj )+ − i (Im zj )− .
j∈I j∈I j∈I j∈I j∈I
Exercice .
1.1 Vérier que la somme d'une famille sommable est une application linéaire. (indication :
considérer une suite exhaustive de parties nies pour se ramener au cas des sommes nies).
X X
zj = zj ,
j∈I j∈I
X X
zj ≤ |zj |.
j∈I j∈I
15
Démonstration. 1/ Les bornes | Re zp
i | ≤ |zi | et | Im zi | ≤ |zi | donnent la condition nécessaire par
domination. Réciproquement |zi | = | Re zi |2 + | Im zi |2 ≤ | Re zi | + | Im zi | et comme ℓ1 est un e.v,
on a vu que l'hypothèse implique (| Re zi | + | Im zi |)i∈I sommable d'où le résultat à nouveau par
domination.
2/ l'équivalence est évidente en utilisant 2 fois le 1. L'égalité vient directement de la dénition.
3/ On xe une suite exhaustive Jn de I. D'après le critère des suites exhaustives pour les
P P P
quatre séries à termes positives intervenant dans la somme,
P j∈I zj = limn→∞ j∈Jn zj , j∈I |zj | =
limn→∞ j∈Jn |zj | donc par l'inégalité triangulaire pour les sommes nies (et continuité du module)
X X X X X
zj = lim zj = lim zj ≤ lim |zj | = |zj |.
n→∞ n→∞ n→∞
j∈I j∈Jn j∈Jn j∈Jn j∈I
4/ Tout vient du cas positif, soit par la dénition de sommabilité soit par la dénition de la
somme en terme de somme de familles à termes positifs. Le cas particulier vient du fait que si la
famille est indicée par IN, le critère des suites exhaustives (appliqué à la suite [[0, n]]) implique qu'être
sommable équivaut à être absolument convergente.
On nit avec les résultats de sommation par paquets et de Fubini. Dans les deux cas, on n'a plus
d'équivalence comme dans le cas à terme positif. On utilise alors souvent/toujours le cas à terme
positif pour montrer la sommabilité nécessaire à appliquer le cas avec signe/complexe.
Théorème 1.19. (de sommation par paquetss) Soit (I ) une partition de I . Si une famille (z )
est sommable alors on a les deux propriétés suivantes :
λ λ∈Λ i i∈I
De plus, on a l'égalité :
λ λ∈Λ
!
X X X X
zi = σλ ≡ zi .
Démonstration.
i∈I λ∈Λ λ∈Λ i∈Iλ
Comme (|zi |)i∈I , la sommabilité de (|zi |)i∈Iλ vient du cas positif. De plus, par l'in-
P P
i∈Iλ zi | ≤
égalité triangulaire des familles sommables ( proposition 1.18), i∈Iλ |zi | et le théorème |
de sommation par paquets assure la sommabilité du membre de droite, donc par comparaison, celle
de (σλ )λ∈Λ comme voulu. L'égalité vient du cas positif appliqué aux parties positives et négatives des
parties réelle et imaginaire.
En appliquant la sommation par paquets à la même partition que dans le cas positif, on obtient :
Théorème 1.20. (de Fubini) Si une famille double (z ) est sommable alors on a les deux
propriétés suivantes :
i,j i∈I,j∈J
1. pour tout i ∈ I , (z ) est sommable et la famille des sommes (PP z ) est sommable
2. pour tout j ∈ J , (z ) est sommable et la famille des sommes ( z ) est sommable
i,j j∈J j∈J i,j i∈I
De plus, on a l'égalité :
i,j i∈I i∈I i,j j∈J
! !
X X X X X
zi,j = zi,j = zi,j .
(i,j)∈I×J i∈I j∈J j∈J i∈I
16
Chapitre 2
Métriques
Dénition 2.2. E un IK-e.v. Une norme sur E est une application n : E → [0, +∞[ telle que :
Soit
i ∀x ∈ E, λ ∈ IK n(λx) = |λ|n(x) (homogénéité)
ii ∀x, y ∈ E n(x + y) ≤ n(x) + n(y) (inégalité triangulaire ou sous-additivité)
iii ∀x ∈ E n(x) = 0 ⇐⇒ x = 0 (séparation)
Souvent on note n(x) = ||x||, sauf dans l'exemple E = IK, n(x) = |x|. Un couple (E, ||.||) est appelé
espace vectoriel normé (evn).
Exemple . 2.1 Soit X ⊂E une partie (non-vide) avec d(x, y) = ||x − y||, alors (X, d) est un espace
métrique et tout espace métrique est de cette forme.
n
X
||X||1 = |xi |
i=1
v
u n
uX
||X||2 = t |xi |2 (norme euclidienne)
i=1
17
Exemple .2.3 Si E = C 0 ([a, b], IR) l'ensemble des fonctions continues sur [a, b], on a trois normes :
Z b
||f ||1 = |f (t)|dt
a
s
Z b
||f ||2 = |f (t)|2 dt
a
Cette dernière norme est la norme de la convergence uniforme (la convergence pour ||.||∞ coïncidera
avec la convergence uniforme)
Lemme 2.1. (ℓ1 (I, IK), || · ||1 ) est un espace vectoriel normé.
Démonstration. || · || λ = µ = 1 du lemme 1.17). De plus || · ||1
1 vérie l'inégalité triangulaire (cas
est positif. Comme |ai | ≤ ||a||1 , ai = 0 si ||a||1 = 0, pour tout i donc a = 0 ce qui donne l'axiome
P P
de séparation. Enn i∈J |λai | = |λ| i∈J |ai | donc en passant au sup : |λ| ||a||1 = ||λa||1 (d'où
l'homogénéité).
2 Métriques équivalentes
Dénition 2.3. Soit X un ensemble. Deux distances d1 et d2 sur X sont dites équivalentes si
Remarque . 2.1 L'équivalence des distances est une relation d'équivalence, c'est à dire qu'elle est
réexive (d1 ∼ d1 ), symétrique (d1 ∼ d2 ⇒ d2 ∼ d1 ) et transitive ( d1 ∼ d2 , d2 ∼ d3 ⇒ d1 ∼ d3 ). Si
deux normes sont équivalentes les notions d'analyses (limite, continuité, ...) sont les mêmes pour les
deux normes.
Exemple .2.6
n
Dans IR , ||.||1 , ||.||2 , ||.||∞ sont équivalentes (cf. TD de L2). On verra plus tard qu'en
dimension nie toutes les normes sont équivalentes.
18
3 Boules dans un e.m.
Dénition 2.4. a∈X r ∈ [0, ∞[.
boule ouverte de centre a et de rayon r
Soient et
On appelle de X la partie :
4.1 Convergence
Dénition 2.6. (Convergence) Soit(un ) une suite d'un em (X, d). On dit que un converge vers
l ∈ X (et on note l = limn→∞ un ou un →n→∞ l) si la suite numérique d(un , l) converge vers 0,
c'est-à-dire :
∀ϵ > 0, ∃n0 ∈ IN, ∀n ≥ n0 , d(un , l) ≤ ϵ.
Remarque . 2.2 Ceci équivaut à ∀ϵ > 0, ∃n0 ∈ IN, ∀n ≥ n0 ,
un ∈ B(l, ϵ). Comme dans IR on a
unicité de la limite (justiant la notation). En eet si on a deux limites l1 , l2 pour n grand un ∈
B(l1 , ϵ) ∩ B(l2 , ϵ) donc par inégalité triangulaire d(l1 , l2 ) ≤ d(l1 , un ) + d(un , l2 ) ≤ 2ϵ Comme ϵ > 0
arbitraire d(l1 , l2 ) = 0, soit par l'axiome de séparation l1 = l2 .
(iii) Si E est un evn u → u, v → v alors pour toute suite λ ∈ IK, tel que λ → λ on a
λ u + v → λu + v .
n n n n
n n n
||λn un + vn − (λu + v)|| ≤ |λn |||un − u|| + ||vn − v|| + |λn − λ|||u|| → 0.
19
4.2 Suite extraite, valeur d'adhérence
Dénition 2.7. Soit (un ) une suite de X on appelle suite extraite ou sous-suite une suite de la forme
vn = uϕ(n) , pour ϕ : IN → IN une application strictement croissante
Proposition 2.4. Toute suite extraite d'une suite convergente converge vers la même limite. (Au-
trement dit, toute suite convergente n'a qu'une seule valeur d'adhérence, sa limite.)
Démonstration. u → l
Supposons n v et si d(v , l)
n une suite extraite, d(u , l)
n est extraite de n ( le
résultat est donc une conséquence du cas réel).
Proposition 2.5. Toute suite convergente est de Cauchy. Toute suite de Cauchy est bornée. Toute
suite de Cauchy possédant une valeur d'adhérence est convergente.
Dénition 2.10. X complet X
espace de Banach
Un espace métrique est dit si toute suite de Cauchy de converge
dans X . Si un evn E est complet on dit que c'est un .
Proposition 2.6. Un evn E est complet si et seulement si toute série absolument convergente est
convergente.
Démonstration.
P p
Si E est complet et (xi ) est absolument convergente, la suite des sommes partielles
Pq−1 Pq
Sp = x
i=1 i vérie, pour q > p, ||Sp − Sq || ≤ k=p ||xi || donc comme k=1 ||xi || est convergente
donc de Cauchy, on déduit que (Sp ) est de Cauchy donc converge.
Réciproquement, si toute suite absolument convergente converge, soit (xi ) une suite de Cauchy. Il
sut de montrer qu'elle admet une sous-suite convergente pour voir qu'elle converge. Par la propriété
1
de Cauchy, on trouve par induction ||xnk+1 || avec ||xnk+1 −xnk || ≤ k de sorte que la série télescopique
P 2
xnk+1 − xnk est absolument convergente donc converge, et donc la sous-suite (xnk ) converge.
Exemple . 2.7 Dans le cadre de l'exemple 2.3, vous avez vu en L2 que toute série normalement conver-
gente de (C 0 ([a, b], IR), ||.||∞ ) converge uniformément. D'après le résultat précédent, c'est équivalent
0
à dire que (C ([a, b], IR), ||.||∞ ) est un
espace de Banach (aussi vu directement en L2 en analyse 2
0
Prop 7.6). Par contre ce n'est pas le cas de (C ([a, b], IR), ||.||i ), i = 1, 2. On verra qu'ils sont denses
i
dans les espaces de Lebesgue L ([a, b], IR) qui seront eux complets, et sont les constructions de base
de la théorie de l'intégration de Lebesgue.
20
5.1 Théorème de Point xe
Théorème 2.8. Soit (X, d) un espace métrique complet, et f : X → X une application telle que
∃k < 1 ∀x ̸= y ∈ X d(f (x), f (y)) ≤ kd(x, y) .
n−1
X n
X
n i
d(xn+1 , x0 ) ≤ d(xn+1 , xn ) + d(xn , x0 ) ≤ k d(x1 , x0 ) + k d(x1 , x0 ) = k i d(x1 , x0 )
i=0 i=0
1
Or on reconnaît une série géométrique convergente, d'où la borne : d(xn+1 , x0 ) ≤ 1−k
d(x1 , x0 ).
Montrons que xn est de Cauchy. En eet, pour m > n,
1
d(xn , xm ) = d(f ◦n (x0 ), f ◦n (xm−n ) ≤ k n d(x0 , xm−n ) ≤ k n d(x1 , x0 )
1−k
1
Comme k n 1−k → 0, on déduit que pour N m > n ≥ N d(xn , xm ) est arbitrairement
grand et
petit, donc xn est de Cauchy. Par complétude de X , on obtient donc que xn converge, disons
vers x. Maintenant, en passant à la limite dans (2.1), on obtient d(f (x), x) = limn d(f (xn ), xn ) ≤
lim supn d(f (xn ), xn ) ≤ lim supn k n d(x1 , x0 ) = 0 donc par séparation f (x) = x et x est le point xe
cherché.
Dénition 2.11. Une partie O⊂X est un ouvert (ou une partie ouverte) si
∀x ∈ O, ∃r > 0, B(x, r) ⊂ O.
21
Démonstration. Soit a ∈ X, r > 0 montrons que B(a, r) est un ouvert (B(a, 0) est vide donc ouvert).
Soit x ∈ B(a, r), r − d(x, a) > 0, il sut donc de montrer que :
C'est une conséquence de l'inégalité triangulaire. En eet, si y ∈ B(x, r − d(x, a)), alors d(y, a) ≤
d(y, x) + d(x, a) < (r − d(x, a)) + d(x, a) = r, donc y ∈ B(a, r).
Démonstration. 1. évident.
2. Soit (Oi )i∈I une famille d'ouverts. On peut supposer I non vide (sinon l'union vide étant vide
on est ramené à 1). Soit x ∈ O = ∪i∈I Oi , donc il existe j ∈ I , x ∈ Oj . Comme Oj est ouvert
il existe r > 0, B(x, r) ⊂ Oj ⊂ O. Donc O est ouvert.
3. Soit O1 , ..., On x ∈ O = O1 ∩ · · · ∩ On . Comme x ∈ Oi , et Oi
une famille nie d'ouverts. Soit
ri > 0, B(x, ri ) ⊂ Oi . Soit r = mini=1...n ri > 0. On déduit de la dénition que
ouvert, il existe
B(x, r) ⊂ B(x, ri ) ⊂ Oi donc B(x, r) ⊂ O, ce qui montre que O est ouvert.
Proposition 2.11. (Ouverts pour la métrique induite) Soit A ⊂ (X, d) avec la métrique induite, O
est un ouvert de A, si et seulement si il existe un ouvert U de X tel que O = U ∩ A.
Démonstration. O
On suppose A
ouvert de x∈O
. Pour chaque r >0 B (x, r ) ⊂ O
, on xe x tel que A x .
On pose alors
[
U= BX (x, rx )
x∈O
22
6.2 Intérieur
Dénition 2.12. Soit A ⊂ X, on dit que x est intérieur à A (ou A est un voisinage de x) si
∃r > 0, B(x, r) ⊂ A.
On note Int(A) ou Å l'ensemble des points intérieurs à A.
Démonstration.
c
Supposons
c
F fermé. Soit(x ) n F x
une suite d'éléments de
c
, convergente vers . Soit
y∈F , comme F est ouvert il existe ϵ > 0 B(y, ϵ) ⊂ F , d'où xn ̸∈ B(y, ϵ) Donc d(xn , y) ≥ ϵ. En
passant à la limite on déduit
2. Si C⊂E est complet et F ⊂ C . Soit xn une suite de Cauchy de F , elle converge dans C , donc
comme F est fermé, la limite est dans F , donc toute suite de Cauchy de F converge dans F .
Proposition 2.17. (Fermés pour la métrique induite) Soit A ⊂ (X, d) avec la métrique induite, F
est un fermé de A, si et seulement si il existe un fermé C de X tel que F = C ∩ A.
7.1 Adhérence
Dénition 2.14. A ⊂ X . Un point x ∈ X est dit
Soit adhérent à A si ∀ϵ > 0B(x, ϵ) ∩ A ̸= ∅.
On note Ā (ou Adh(A)) l'ensemble des points adhérents à A.
Exemple 2.11 . X̄ = X, ∅¯ = ∅, A ⊂ Ā . Si r > 0, B(a, r) = BF (a, r). Si A = {xn }n∈IN les valeurs
d'adhérence de la suite (xn ) sont dans Ā qui est l'union de l'ensemble des valeurs d'adhérence et de
A (exo).
Proposition 2.18.
(Adh(A))c = Int(Ac ).
(Int(B))c = Adh(B c ).
24
Démonstration. Un point x ∈ X n'appartient pas à Adh(A) si et seulement si ∃ϵ > 0, B(x, ϵ) ∩ A =
∅ ⇐⇒ ∃ϵ > 0, B(x, ϵ) ⊂ Ac . C'est par dénition équivalent à dire que x est un point adhérent à
Ac .En appliquant le premier résultat à A = B c , on en déduit le second.
On en déduit toutes les propriétés en passant au complémentaire celles de l'intérieur.
Démonstration. A
Si x est adhérent à n B(x, 1/n) ∩ A
pour tout entier est non vide donc contient
IN
un élément an . La suite (an ) ∈ A converge vers x vu ||an − x|| ≤ 1/n → 0. La réciproque vient de
la caractérisation séquentielle des fermés vu Ā fermé.
Exemple 2.12 . A = {(x, y), x > 0, y > 0} alos A = B = {(x, y), x ≥ 0, y ≥ 0}. On a
Montrons que si
vu à l'exemple 2.10 que B A ⊂ B , on en déduit A ⊂ B
est fermé, donc comme
Il reste à montrer que B − A = {(x, y), x = 0, y ≥ 0 ou y = 0, x ≥ 0} ⊂ A. Or (0, y) =
limn→∞ (1/n, y + 1/n) et si y ≥ 0, (1/n, y + 1/n) ∈ A, donc (0, y) ∈ A. De même (x, 0) = limn→∞ (x +
1/n, 1/n) ∈ A si x ≥ 0.
Exemple 2.13 Q .
l et Q
l
c
sont denses dans IR.
Dénition 2.16. Un point x ∈ X est dit point frontière d'une partie A si pour tout r > 0, B(x, r)
est d'intersection non vide avec A et Ac . On note Fr(A) l'ensemble des points frontières de A.
Exercice .2.3 Montrer que Int(Ac ), Fr(A), Int(A) forment une partition de X (i.e. sont disjoints deux
à deux et leur union est X ).
25
8 Fonctions continues
8.1 Dénitions équivalentes
On considère (X, dX = d) et (Y, dY = d) deux em.
Démonstration. f
Supposons que l = f (x) x
tend vers ϵ > 0 η > 0 en . Soit il existe tel que
f (B(x, η)) ⊂ B(l, ϵ). Vu que xn → a il existe N , tel que ∀n ≥ N, d(xn , a) ≤ η donc ∀n ≥
N, d(f (xn ), l) ≤ ϵ. Ceci indique que f (xn ) → l.
Réciproquement, supposons par contraposition, qu'il existe ϵ > 0 tel que pour tout η > 0
f (B(x, η)) ∩ B(l, ϵ)c ̸= ∅. Donc, en prenant, η = 1/n, on obtient xn ∈ B(x, 1/n), tel que d(f (xn ), l) ≥
ϵ. Pour tout n, donc xn → a et f (xn ) ne converge pas vers l comme voulu.
Démonstration. 2. ⇐⇒ 3. (f (B)) = (f (B ))
vient de
−1 c −1 c
et de la relation fermés/ouverts.
1. ⇒ 2. Soit O Y et x ∈ O, il existe et on choisit ϵ(x) > 0 tel que B(x, ϵ(x)) ⊂ O.
un ouvert de
Par continuité de y ∈ f −1 (O), f (y) = x ∈ O, il existe δ(y) > 0 tel que f (B(y, δ(y))) ⊂
f, soit
B(x, ϵ(f (y))) ⊂ O. Donc B(y, δ(y)) ⊂ f −1 (O) et comme y est arbitraire, f −1 (O) est ouvert.
2. ⇒ 1. Soit a ∈ A. Montrons que limx→a f (x) = f (a). Soit ϵ > 0. Par 1. V = f −1 (B(f (a), ϵ)) est
un ouvert X . Or a ∈ V donc ∃δ > 0 tel que B(a, δ) ⊂ V . En conséquence
ce qui conclut.
est ouvert par coninuité de f, mais f (g (U )) = (g ◦ f ) (U ). Comme c'est vrai pour tout ouvert
U, on déduit de nouveau du théorème précédent que g ◦ f est continue.
26
Exemple 2.14 . 1. f : X → IR dénit par f (x) = d(x, z) est continue sur E car |d(x, z) −
d(x0 , z)| ≤ d(x, x0 ) (inégalité triangulaire inverse).
2. Soit 0 ≤ p ≤ n = r + s, p : Rn → IRs dénie par si x = (y, z) ∈ IRn = IRr × IRs , p(x) = z . On
n s
munit IR et IR des normes ||.||1 , on voit ||p(x)||1 ≤ ||x||1 , donc comme p est linéaire, p est
continue car ||p(x) − p(y)||1 = ||p(x − y)||1 ≤ ||x − y||1 .
Remarque . 2.6 Il résulte des théorèmes sur les limites que les opérations algébriques usuelles (somme,
produit, composition) préservent la continuité. En particulier si P est une fonction polynomiale
P : IRn → IR c'est à dire de la forme P (x) = finie ai1 ,...,in xi11 . . . xinn est continue comme somme et
P
produits des projections (x1 , ..., xn ) 7→ xi .
Démonstration. x ∈ X Soit a ∈D
, on sait par caractérisation séquentielle de l'adhérence qu'il existe n
avec an → x. Par continuité de f, g en x, et caractérisation séquentielle de la continuité : f (an ) →
f (x), g(an ) → g(x). Mais on sait que f (an ) = g(an ) par hypothèse, donc par unicité de la limite dans
Y , f (x) = g(x). Comme x est arbitraire, on a f = g .
Exemple . f : → f (x) = √x
2.15 IR+ IR est uniformément continue mais pas lipschitzienne (cf TD.).
Toute application uniformément continue est continue mais la réciproque est fausse : g : IR → IR
g(x) = x2 n'est pas uniformément continue sur IR (cf TD.).
x 7→ d(x, z) est 1-lipschitzienne X → IR, (x, y) 7→ x + y est 2-lipschitzienne E × E → E.
Le résultat suivant ne doit pas être confondu avec le Théorème 2.24qui ne donne que l'unicité
d'un prolongement mais pas son existence.
Théorème 2.27 (de prolongement des applications uniformément continues). Si f : (D, d) → (Y, d)
est une applications , D ⊂ (X, d) est dense et (Y, d) est . Alors
f admet un unique prolongement continue g : (X, d) → (Y, d) et celui-ci est uniformément continue.
uniformément continue complet
27
Démonstration. L'unicité vient du Théorème 2.24.
Soit x ∈ X , et par densité xn ∈ D, xn → x. Comme f est uniformément continue soit ϵ > 0 et
δ > 0 tel que dX (x, y) < δ ⇒ dY (f (x), f (y) ≤ ϵ. Si on prend N tel que d(xn , xm ) < δ , pour n, m ≥ N ,
on voit que dY (f (xn ), f (xm )) ≤ ϵ, donc comme ϵ est arbitraire, (f (xn )) est de Cauchy. Donc (f (xn ))
converge vers z ∈ Y par complétude.
Soit yn → x une autre telle suite, alors d(f (yn ), z) ≤ d(f (xn ), f (yn )) + d(f (xn ), z) → 0, car
d(f (xn ), f (yn )) ≤ ϵ dès que d(xn , yn ) ≤ δ et on voit donc que d(xn , yn ) → 0 implique que d(f (xn ), f (yn )) →
0. Donc la limite z ne dépend pas de la suite choisie. On pose g(x) = z .
En particulier, g étend f (en considérant la suite constante). Soit z ∈ X avec d(x, z) < δ et
zn → z alors pour n assez grand d(xn , zn ) < δ donc dY (f (xn ), f (zn ) ≤ ϵ et on déduit en passant à la
limite dY (g(x), g(z)) ≤ ϵ. Donc g est uniformément continue (avec même constantes que f ).
Démonstration. f
On a vu que ce sont des espaces normés. Montrons qu'ils sont complets. Soit n
une suite de Cauchy, donc comme ||fp (x) − fq (x)||F ≤ ||fp − fq ||∞ , pour tout x ∈ X , (fp (x)) est de
Cauchy, donc par complétude de F , converge vers une valeur f (x). Soient p, q tels que pour tout x
||fp (x) − fq (x)|| ≤ ϵ en prenant la limite q → ∞, on déduit ||fp (x) − f (x)|| ≤ ϵ donc ||fp − f || ≤ ϵ.
Donc fp converge uniformément vers f , donc f est continue (résultat de L2 ou exo). De plus, ||fp ||∞
est convergente, donc de Cauchy, donc bornée, disons par M . En passant à la limite dans l'inégalité
||fp (x)||F ≤ M , on obtient ||f (x)||F ≤ M et donc f est aussi bornée par M . Donc la limite f est
continue bornée et fp converge vers f dans Cb (X, F ). Ce qui donne la complétude.
Démonstration. 1. ⇒ 2. 2. ⇒ 3. 3. ⇒ 4. 4. ⇒ 5.
(Preuve facultative) , , , sont évidentes (et n'utilisent
pas la linéarité). Si on suppose 5., il existe η > 0 tel que si ||x − a|| ≤ η alors ||u(x) − u(a)|| ≤ 1. Soit
h ∈ E , h ̸= 0, x = a+hη/||h|| de sorte que ||x−a|| ≤ η , on déduit donc ||u(h)||η/||h|| = ||u(x−a)|| ≤ 1
c'est-à-dire ||u(h)|| ≤ ||h||/η (ce qui est aussi vrai pour h = 0). En particulier, si ||h|| ≤ 1, on obtient
donc 6.
Si on suppose 6., on montre nalement 1, on pose C = sup||h||≤1 ||u(h)|| < ∞ et on obtient de
même pour h ̸= 0, ||u(h/||h||)|| ≤ C donc ||u(h)|| ≤ C||h|| (ce qui est aussi vrai pour h = 0). Donc
pour tout x, y en utilisant encore la linéarité u(x − y) = u(x) − u(y), on obtient :
Démonstration. ϕ Si ϕ ({0})
est continue,
−1
est fermé comme image inverse d'un singleton, qui est
fermé. Réciproquement, supposons ϕ non nulle, soit e tel que ϕ(e) = 1. Comme le complémentaire
c
de H est ouvert soit r > 0 tel que B(e, r) ⊂ H .
Montrons par l'absurde que pour tout x ∈ B(e, r), ϕ(x) ∈ B(1, 1). En eet, sinon soit x avec
|ϕ(x)−1| ≥ 1. Si t = −ϕ(x)/(1−ϕ(x)), on ϕ(te+(1−t)x) = t1+(1−t)ϕ(x) = t(1−ϕ(x))+ϕ(x) = 0.
Or ||te + (1 − t)x − e|| = |1 − t|||x − e|| = ||x − e||/|ϕ(x) − 1| ≤ r une contradiction car alors
y = te + (1 − t)x ∈ B(e, r) ∩ H .
On a donc vu ϕ(B(e, r)) ⊂ B(ϕ(e), 1) d'où ϕ continue par la proposition précédente.
Dénition 2.20. L'espace E ′ := L(E, IK) des formes linéaires continues sur un e.v.n. E est munie
de la norme d'opérateur
||f ||E ′ := sup |f (x)|.
x∈E,||x||E ≤1
Dénition 2.21. L'espace L(E, F ) des applications linéaires continues d'un e.v.n. E vers un e.v.n.
F est munie de la norme d'opérateur (ou norme subordonnée) :
Remarque . 2.8 La preuve de 6. implique 5. dans la proposition 2.29 montre en fait que si f ∈ L(E, F )
alors f est |||f |||-lipschitzienne.
Un espace dual est toujours complet par le résultat suivant :
Théorème 2.31. Si E est un e.v.n. et F un espace de Banach, alors (L(E, F ), |||.|||) est un espace
de Banach.
Démonstration. Soit B la boule fermée de E de centre 0 et de rayon 1 et i : L(E, F ) → Cb (B, F ) la
restriction à la boule. Par dénition des normes, c'est une isométrie qui identie donc L(E, F ) à un
sous espace de Cb (B, F ). Montrons que ce sous espace est fermé (il sera donc complet par complétude
de Cb (B, F ) par théorème 2.28).
29
Montrons que
i(L(E, F )) = {u ∈ Cb (B, F ) : ∀λ, µ ∈ K|λ| + |µ| ≤ 1, ∀x, y ∈ B, u(λx + µy) = λu(x) + µu(y)}.
Cela sut car cela décrit i(L(E, F )) comme une u 7→ u(y) est une
intersection de fermé vu que
application continue sur Cb (B, F ). L'inclusion ⊂ u est continue
est évidente. Réciproquement si
x
sur B donc en 0 et dans l'ensemble indiqué, pour x ∈ E \ {0}, on pose uE (x) = ||x||E u( ) et
||x||E
uE (0) = 0. D'abord, si ||x|| ≤ 1 on remarque que uE étend la précédente valeure de u sur B (en
prenant y = 0 dans la relation). De même, uE est positivement homogène. Donc, si (x, y) ̸= 0, on
′ ′ ′ ′
pose x = x/ max(||x||, ||y||), y = y/ max(||x||, ||y||), λ = λ/(|λ|+|µ|), µ = µ/(|λ|+|µ|) pour obtenir
′ ′ ′ ′
par homogénéité et la relation appliquée à x , y , λ , µ :
Donc uE est linéaire continue en 0, donc linéaire continue et u = i(uE ) comme souhaité.
Dénition 2.22. Une application linéaire u:E→F est une isométrie (linéaire) si :
∀x ∈ E, ||u(x)|| = ||x||.
30
10.2 Applications linéaires
Rappel . 2.9 Si E de dimension n
F de dimension p. Soit (e1 , ..., en ) une base de E , (f1 , ..., fp ) une
et
base de F . Une application linéaire u est décrite par sa matrice A = (aij )i∈[1,p],j∈[1,n] dans ces bases.
Pn Pp
Alors, si x = j=1 xj ej et y = u(x) = i=1 yi fi , on rappelle que :
n
X
yi = aij xj .
j=1
On dénit aussi la base duale (e∗1 , ..., e∗n ) de l'ev des formes linéaires sur E caractérisés par e∗j (ek ) =
1 si j=k et 0 sinon. En conséquence, pour tout x ∈ E :
n
X n
X
u(x) = xj u(ej ) = e∗j (x)u(ej ).
j=1 j=1
Théorème 2.34. Toute application linéaire entre evn de dimensions nies est continue (et même
lipschitzienne).
Démonstration. En utilisant la représentation du rappel
n
X
u= u(ei )e∗i ,
i=1
il sut de montrer que les formes linéaires e∗i sont continues. Mais Ker e∗i est un sous-espace vectoriel
de dimension ni donc complet (Théorème 2.33), donc fermé (proposition 2.16) dans E, d'où la
continuité voulue (proposition 2.30). La lipschitzianité vient de la proposition 2.29.
Remarque 2.10 . Sur Rn on peut donc parler de continuité, limite etc. sans préciser la norme.
Proposition 2.36. Soient E un evn, A ⊂ E , f : A → IRn . Si x ∈ A, on note f (x) = (f1 (x), ..., fn (x))
où les f sont les fonctions composantes de f : f : A → IR.
Soit x ∈ Ā et b = (b , ..., b ) ∈ IR , alors on a l'équivalence :
i i
n
1 n
31
Démonstration. On a fi = pi ◦f , où pi est i-ème projection pi : IRn → IR dénie par pi (x1 , ..., xn ) = xi .
pi est continue d'après l'exemple 2.14.2.
Si limx→a f (x) = b, limx→a fi (x) = bi d'après le Théorème de composition des limites.
on déduit
n
Réciproquement, on munit IR de la norme ||.||∞ . Si pour tout i limx→a fi (x) = bi on a donc pour
ϵ > 0, l'existence de δi > 0 tel que si ||x − a|| ≤ δi , ||fi (x) − bi || ≤ ϵ. On pose δ = mini=1...n (δi ) > 0.
Donc si ||x − a|| ≤ δ , pour tout i ||fi (x) − bi || ≤ ϵ donc ||f (x) − b||∞ = max ||fi (x) − bi || ≤ ϵ.
où les f sont les fonctions composantes de f : f : A → IR. f est continue sur A (resp. en a ∈ A) si
1 n
Alors A est bornée dans IR si et seulement si pour tout i, p (A) est bornée dans IR.
i i 1 n i
n
i
Proposition 2.40. Un compact K d'un espace métrique X est un fermé borné de X . Un sous-
ensemble fermé d'un compact est compact. Le produit de 2 espaces compacts est compact.
Démonstration. K
1. Un compact (u ) l E
est fermé, car si une suite n converge vers dans , elle
admet une sous-suite convergeant vers k ∈ K, dont la limite est nécessairement l=k (propo-
sition 2.4), donc l ∈ K.
2. On montre par contraposée qu'un ensemble non borné A ne peut pas être compact. Si A
non-borné, soit xn ∈ A tel que d(xn , y) ≥ n, si une suite extraite xϕ(n) → x convergeait, elle
serait bornée, ce qui n'est pas le cas car d(xϕ(n) , y) ≥ ϕ(n) →n→∞ ∞.
3. Si F ⊂K avec K compact, F fermé, une suite de F admet une sous suite convergeant dans
K par compacité, donc sa limite est dans F par fermeture, d'où F compacte.
Exemple 2.17 .
F = {(x, y) ∈ IR2 , xy = 1} est fermé mais pas compact. En eet, si f (x, y) = xy
Soit
2 −1
est polynomiale donc continue IR → IR donc F = f ({1}) est fermé comme image réciproque d'un
fermé par une application continue. Mais F n'est pas compact car pas borné. xn = (1/n, n) ∈ F et
||xn ||∞ = n → ∞.
32
Remarque . 0
2.12 En général dans un evn un fermé borné n'est pas toujours compact. Dans C ([0, 1], IR),
n
montrons que la boulde unité fermée n'est pas compacte. fn (x) = x vérie ||fn ||∞ = 1, mais comme
fn (x) → f (x) (on dit converge simplement vers f ) avec f (x) = 0 si x < 1, f (1) = 1, donc f non
continue. Toute suite extraite de f devrait converger vers cette limite qui n'est pas continue, donc
elle ne peut pas converger dans C 0 ([0, 1], IR) vers cette limite qui n'est pas dans C 0 ([0, 1], IR). En
général, on peut montrer que les boules fermées d'evn sont compactes si et seulement si l'evn est de
dimension nie, on montre une implication ci-dessous.
Théorème 2.41. Si u : E → F est continue et K ⊂ E est compacte alors u(K) est compacte.
Démonstration. Soit yn une suite de u(K) donc yn = u(xn ) ,avec (xn ) suite de K , on extrait donc
une suite xϕ(n) convergeant vers x ∈ K . Par continuité, la suite extraite yϕ(n) = u(xϕ(n) ) → u(x) ∈
u(K).
Corollaire 2.42. (Thm de Weierstrass) Si K ⊂ X e.m. est compacte et f : K → IR est continue,
alors la fonction f est bornée et atteint ses bornes : ∃x , x ∈ K, ∀x ∈ Kf (x ) ≤ f (x) ≤ f (x ).
0 1 0 1
Démonstration. f (K) f
est compacte donc fermée et bornée. Donc f (K)
est bornée, et le contient son
sup et son inf (par fermeture) c'est-à-dire, il existe y0 , y1 ∈ f (K) y0 = inf x∈K f (x), y1 = supx∈K f (x).
Finalement yi = f (xi ) avec xi ∈ K .
Corollaire 2.43. Soit X, K deux espaces métriques avec K compact et f : K → X une bijection
continue, alors f est une homéomorphisme (c'est-à-dire f est continue et X est aussi compacte).
−1
Démonstration. f Comme F ⊂K
bijective, pour un fermé (f ) (F ) = f (F )
, donc un compact,
−1
−1 −1
est
l'image directe du compact F dans X , donc est compact donc fermé. f envoie donc un fermé sur
un fermé, donc est continue par caractérisation topologique de la continuité (Proposition 2.22).
Théorème 2.44. Dans un evn de dimension nie, les compacts sont exactement les fermés bornés.
Démonstration. Il reste à montrer que les fermés bornés sont compacts. D'après le théorème 2.34 un
n n −1
isomorphisme linéaire u de E sur IK est continu de (E, ||.||) sur (K , ||.||∞ ), et u également. u(K)
−1
est fermé comme image réciproque d'un fermé par u continue, u(K) est borné comme image d'un
n
borné par une application lipschitzienne. Donc L = u(K) est un fermé borné de (K , ||.||∞ ). Il sut
−1
de voir que c'est un compact, car alors K = u (L) est compact comme image continue d'un compact
(1) (n) (i)
(theorème 2.41). Soit (xp ) = (xp , ..., xp ) une suite de L, par dénition de la norme (xp ) sont bornés,
elles admettent donc, par le théorème de Bolzano-Weierstrass dans IK, une sous-suite simultanément
(i) (i) (1) (n) (i)
convergente. xϕ(p) → x Donc si x = (x , ..., x ), on a ||xϕ(p) − x|| = maxi=1...n |xϕ(p) − x(i) | → 0
et comme L est fermé ; x ∈ L ce qui conclut.
Exemple 2.19 .g : K → IR dénie par g(x, y) = x2 + y 2 g est continue donc atteint ses bornes
Soit
sur K compact. En eet g est la distance euclidienne à l'origine, il est facile de voir qu'elle atteint
√
son maximum 2 en (0, ± 2) sur K et son minimum 1 en (±1, 0) sur K . Le théorème des extremas
liés permettra de retrouver ce résultat pour des g et des K plus généraux.
Théorème 2.45. (de Heine) Toute fonction continue f sur un compact K ⊂ X est uniformément
continue.
33
Démonstration. 2
Soit g : (x, y) → d(f (x), f (y)) de K 2 dans IR elle est continue (pour la
2
distance
produit sur X par composition) donc g(K ) est compact. Soit ϵ > 0 reste à trouver un δ de
continuité uniforme.
Dénition 2.24. Un espace métrique (X, d) est précompact si pour tout ϵ > 0, X peut être couvert
par un nombre ni de boules ouvertes de rayon ϵ.
On rappelle le résultat suivant (cf. e.g. Zuily-Quéelec Th II.1 p135 ou Gourdon d'Analyse p 32)
ou la proposition A.7.
Proposition 2.47. Un espace métrique X est compact si et seulement si il est précompact et complet.
i 0 i
i∈I i∈I0
Théorème 2.49. Pour un ensemble K d'un espace métrique X est compact, si et seulement si,
pour
\ tout (F ) est un fermé de K , si pour toute intersection
\ nie (i.e. avec I ni) est non-vide
F ̸= ∅ alors l'intersection complète est aussi non-vide F ̸= ∅.
i i∈I 0
i i
i∈I0 i∈I
34
On dénit E = CM (I, F ) l'ensemble des fonctions continues par morceaux sur I à valeur F .
Comme chaque prolongement par continuité de f]ai ,ai+1 [ est continue sur un compact [ai , ai+1 ], donc
bornée, les fonctions continues par morceaux sont bornées. On note D⊂E l'ensemble des fonctions
en escaliers.
E est donc un Evn (PAS complet) pour la norme de la convergence uniforme, si f ∈E :
Proposition 2.50. Toute application linéaire continue u d'un sous-espace vectoriel dense D d'un
evn E vers un evn complet F se prolonge en une unique application linéaire continue v : E → F ,
ayant la même constante de lipschitzianité que u.
Démonstration. uComme K
est continue donc -lipschitzienne (par proposition 2.29) donc uniformé-
ment continue, l'unique prolongement est donné par le Théorème 2.27.
xn → x, yn → y en passant à la limite dans la relation u(αxn + βyn ) = αu(xn ) + βu(yn ),
Si on
déduit que v est linéaire et avec ||u(xn −yn )|| ≤ K||xn −yn ||, on déduit que v est K -lipschitzienne.
Z Xn a + a
i−1 i
I(ϕ) = ϕ(t)dt = (ai − ai−1 )ϕ .
[a,b] i=1
2
n
X a + a
i−1 i
||I(ϕ)|| ≤ |ai − ai−1 | ϕ ≤ ||ϕ||E |b − a|.
i=1
2 F
Comme les fonctions en escalier sont denses dans les fonctions continues par morceaux (exo. TD), la
proposition précédente permet d'étendre l'intégrale comme quand F = IR et on a :
Dénition 2.26. L'intégrale des fonctions continues par morceaux CM (A, F ) est l'unique
Rb Rb
prolon-
Démonstration.
n
X a + a Z b
i−1 i
||I(ϕ)||F ≤ |ai − ai−1 | ϕ = ||ϕ(t)||F dt
i=1
2 F a
On a toutes les propriétés usuelles, Chasles, linéarité, en particulier si F = IRn et f = (f1 , ..., fn )
Rb Rb Rb
a
f (t)dt = ( a f1 (t)dt, ..., a fn (t)dt).
35
12.1 Rappel sur les Intégrales impropres
Dénition 2.27. Pour une fonction f continue sur un intervalle I → IR qui n'inclut pas toutes ses
bornes ou qui n'est pas borné, on dénit l'intégrale impropre de la manière suivante :
Dans tous ces cas, on dit que l'intégrale est convergente si la limite existe et est nie.
Dans tous les cas, on s'occupera surtout du cas I = [a, b[ puisque le cas I =]a, b] est similaire en
remplaçant f par x 7→ f (−x)
Le cas le plus important est le cas suivant (car on va disposer de théorèmes de comparaison avec
des fonctions positives de références) :
Dénition 2.28. Pour une fonctionR f continue sur un intervalle I (comme dans la dénition précé-
36
converge si et seulement si α < 1 (intégrale de Riemann) et vaut
R1 1
3.
0 tα
dt
Z 1
1 1
α
dt = ,α < 1
0 t 1−α
Z 1
1
dt = +∞, α ≥ 1
0 tα
.
R1 1−a−α+1
En eet si α ̸= 0,
1
a tα
dt = −α+1 et pour α > 1, a−α+1 →a→0 +∞, tandis que pour α <1
a−α+1 →a→0R 1 01
Si α = 1,
a t
dx = | ln(a)| →a→∞ ∞.
R∞ 1
4.
0 tα
dt = +∞ diverge toujours pour tout α ∈ IR(en combinant les 2 points précédents).
⌊pxi ⌋ 1
− xi ≤
p p
n n n n
donc ||xp − x||∞ ≤ 1/p →p→∞ 0. Donc vu xp ∈ Q
l , x ∈ Q
l . Comme x est arbitraire. IR ⊂Q
l
CQFD.
37
Chapitre 3
Introduction à l'optimisation
Vous avez vu en L2 qu'une fonction C 1 f qui atteint un minimum sur un ouvert en x satisfait
2
une condition nécessaire du première ordre ∇f (x) = 0 et si f est C on peut garantir que c'est un
minimum local si sa hessienne est dénie positive.
Il reste les questions : comment avoir un minimum global ? comment avoir unicité du minimum ?
C 2 , sera équivalente
Une réponse va être obtenue en étudiant une notion, qui, dans le cas des fonctions
à une positivité globale de la hessienne. L'avantage est qu'on peut trouver une dénition : la notion
de fonction convexe, sans hypothèse de dérivabilité et qui va être robuste et permettre d'obtenir aussi
des critères d'optimisation du premier ordre, sur des ensembles eux aussi convexes (pas forcément
ouverts).
On suppose donc que E est un espace vectoriel (e.v.) sur IR.
1 Ensembles Convexes
Soit x, y ∈ E , on appelle segment d'extrémité x et y la partie
On retrouve bien sûr la dénition usuelle du segment dans IR. (avec la notation inhabituelle
[−1, −2] = [−2, −1])
Par convention , C = ∅ est convexe même si les convexes intéressants sont les convexes non-vides...
Proposition 3.1. Si E est un e.v.n., les boules (ouvertes et fermés) sont des convexes.
Démonstration. Considérons le cas des boules ouvertes. Soient x, y ∈ B(a, r), z = λx + (1 − λ)y ,
λ ∈ [0, 1].
Par l'inégalité triangulaire et homogénéité, on a :
||z − a|| = ||λ(x − a) + (1 − λ)(y − a)|| ≤ |λ|||x − a|| + |1 − λ|||y − a|| < |λ|r + |1 − λ|r = r.
38
Exemple . 3.1 On pose ||(x, y)||1/2 = (|x|1/2 + |y|1/2 )2 . On note B = {(x, y) ∈ IR2 : ||(x, y)||1/2 ≤ 1}.
On remarque que (1, 0), (0, 1) ∈ B , (1/4, 1/4) ∈ B mais (1/2, 1/2) ̸∈ B donc B n'est pas convexe et
2
|| · ||1/2 n'est PAS une norme sur IR .
Exercice . 3.1 Montrer que les ensembles convexes de IR sont exactement les intervalles.
Proposition 3.2. Si C est convexe, alors son adhérence C et son intérieur Int(C) sont convexes.
Une intersection (nie ou innie) d'ensembles convexes est convexe. Si C ⊂ E, C ⊂ F sont
convexes, alors C × C est convexe dans E × F .
1 2
1 2
Exercice . L
⊥
3.2 Si E
est un s.e.v de (de dimension nie), a ∈ L. Montrer que TL (a) = L et NL (a) =
L = {y ∈ E : ⟨y, a⟩ = 0∀y ∈ L}, est l'orthogonal de L.
Exercice . S 3.3 Si a ∈ Int(S)
convexe et . Montrer que TS (a) = E et NL (a) = {0}.
2 Fonctions convexes
Il est pratique de considérer des fonctions f : E →] − ∞, +∞] = IR ∪ {+∞}. Dans ce cas on parle
de domaine de f :
1. Une fonction f : C →] − ∞, +∞] est dite convexe si pour tout λ ∈]0, 1[, x, y, ∈ C ,
39
2. Une fonction f : C →] − ∞, +∞] est dite strictement convexe si pour tout λ ∈]0, 1[, x, y, ∈ C ,
avec x ̸= y
f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y).
3. Une fonction f : C → [−∞, +∞[ est dite concave si −f est convexe.
Remarque . 3.1 Si f est convexe, alors C ∩ D(f ) est convexe car si f (x) < +∞, f (y) < ∞ alors
On peut donc toujours remplacer soit C par E soit C par C ∩ D(f ) selon votre goût (pour les
fonctions innies ou les ensembles convexes).
2. Si µ > 0, f, g convexes alors µf + g est convexe. De plus, elle est aussi strictement convexe
si f ou g l'est.
3. Si f , i ∈ I sont convexes alors l'enveloppe supérieure f (x) = sup f (x) est convexe.
4. (facultatif) f est convexe ssi g : E →] − ∞, +∞], dénie par g(x) = f (x) si x ∈ C et
i i∈I i
Démonstration. Pour (1), l'énoncé est vide si f (x) ou f (y) = ∞. Soit donc (x, t1 ), (y, t2 ) ∈ Epi(f )
(comme on veut ti < ∞ cela utilise la réduction précédente). On remarque que (λx + (1 − λ)y, λt1 +
(1 − λ)t2 ) ∈ Epi(f ) ssi f (λx + (1 − λ)y) ≤ λt1 + (1 − λ)t2 .
Si les épigraphes sont convexes, cette propriété est vériée et donc en prenant l'inmum sur t1 , t2
(qui donne f (x), f (y)) on a le résultat. Si f vérie l'inégalité, on utilise f (x) ≤ t1 , f (y) ≤ t2 pour
conclure :
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) ≤ λt1 + (1 − λ)t2 .
(1)' On montre la convexité de D = {x : f (x) ≤ t} comme ci-dessus. Soit x, y ∈ D alors pour
λ ∈ [0, 1] : f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) ≤ λt + (1 − λ)t = t. Donc λx + (1 − λ)y ∈ D. Par
−1
contre si g = 1[0,∞[ alors si t < 0 , g (] − ∞, t]) = ∅, si 0 ≤ t < 1 , g −1 (] − ∞, t]) =] − ∞, 0[ et sinon
−1
pour t ≥ 1, g (] − ∞, t]) = IR et ce sont 3 intervalles donc 3 ensembles convexes. Mais g n'est pas
convexe g(0) = 1 > 1/2g(−1) + 1/2g(1) = 1/2.
(2) est évident en utilisant l'inégalité :
µf (λx + (1 − λ)y) + g(λx + (1 − λ)y) ≤ µ(λf (x) + (1 − λ)f (y)) + (λg(x) + (1 − λ)g(y))
= (λ(µf + g)(x) + (1 − λ)(µf + g)(y)).
(3) vient de la stabilité des convexes par intersection et de Epi(f ) = ∩i∈I Epi(fi ).
(4) est évident car Epi(f ) = Epi(g).
(5) si x ̸= y sont deux points atteignant le minima, f ((x + y)/2) < (f (x) + f (y))/2 contredisant
la minimalité.
40
Une propriété importante des fonctions convexes est le fait qu'on peut les caractériser en terme
d'accroissements :
Proposition 3.4. Soit f : E →] − ∞, +∞] une fonction. f est convexe si et seulement si pour tout
x, h ∈ E la fonction ∆ f (t) :=
x,h est croissante sur IR .
f (x+th)−f (x)
t
∗
+
t t t t
f (x + th) = f ( (x + sh) + x(1 − )) ≤ f (x + sh) + f (x)(1 − ).
s s s s
Donc la convexité de f implique la croissance énoncée et réciproquement en prenant s=1 on écrit
toute paire x, y sous la forme y =x+h et l'inégalité ci-dessus se réécrit en l'inégalité dénissant la
convexité de f :
C
( l )
X
NC (x) = λi ∇gi (x), λi ≥ 0 .
i=1
41
Exemple . 3.3 SoitA = {(x, y) ∈ IR2 : x ≥ y ≥ 0, }.
1
Si on pose g1 (x, y) = y − x, g2 (x, y) = −y qui
sont linéaires donc convexes et C , on a :
Exercice . 3.4 1. Pour A de l'exemple précédent, si a = (x, x) pour x > 0. Montrer que NA (a) =
IR+ (−1, 1).
2. Pour b = (x, 0), x > 0. Montrer que NA (b) = IR+ (0, −1).
3. Y-a-t-il d'autres valeurs de NA (c) et si oui, pour quels points c ∈ A?
Proposition 3.7. Une fonction f : I → IR est convexe si et seulement si pour tout a ∈ I , la fonction
∆a f est croissante sur I \ {a}.
On en déduit les inégalités suivantes (inégalité des pentes, cf dessin en cours) sur une fonction f :
Proposition 3.8. Une fonction convexe f : I → IR vérie l' inégalité des pentes :
f (b) − f (a) f (c) − f (a) f (c) − f (b)
∀a, b, c ∈ I, a < b < c ⇒ ≤ ≤ .
b−a c−a c−b
Théorème 3.9. Soit I un intervalle ouvert de IR, et f : I → IR une fonction convexe. Alors pour tout
, admet des dérivées à droite et à gauche en a. On a pour tout x ∈ I : f (x) ≥ f (a)(x−a)+f (a)
a∈I f ′
Démonstration. a ∈ I Soit . Dans le cas d'une fonction à une variable, le corollaire 3.5 implique
l'existence de dérivées à droites et à gauches (pour l'instant peut-être innies). Dans l'inégalité des
+ −
pentes en faisant c → b ou a → b , on obtient :
f (b) − f (a)
−∞ < ≤ fd′ (b),
b−a
f (c) − f (b)
fg′ (b) ≤ < +∞.
c−b
Pour a < b, 0 < ϵi < (b − a)/2, l'inégalité des pentes appliquée aux points a ≤ a + ϵ1 < b − ϵ2 < b
donne :
42
f (a + ϵ1 ) − f (a) f (b − ϵ2 ) − f (a + ϵ1 ) f (b − ϵ2 ) − f (b)
≤ ≤
ϵ1 (b − a − ϵ1 − ϵ2 ) −ϵ2
et en passant à la limite ϵ1 → 0+ ou ϵ2 → 0+ puis les deux, on obtient :
f (b − ϵ2 ) − f (b)
fd′ (a) ≤ ,
−ϵ2
f (a + ϵ1 ) − f (a)
≤ fg′ (b),
ϵ1
fd′ (a) ≤ fg′ (b).
Donc fd′ (a) < +∞, fg′ (a) > −∞, ce qui termine la preuve des dérivabilités à droite et à gauche, et
on a l'inégalité attendue.
De plus, la formulation comme inmum, dans le corollaire 3.5, montre que pour tout x > a
f (x) − f (a) ′
que ≥ fd (a) et donc f (x) ≥ fd′ (a)(x − a) + f (a). De même, pour tout x < a on a
x−a
f (x) − f (a)
≤ fg′ (a) ; en multipliant par x − a (qui est négatif !) on a donc que pour tout x < a
x−a
f (x) ≥ f (a) + fg′ (a)(x − a).
′ ′ − +
De plus, fg (b) ≤ fd (b) (en passant aux limites a → b , c → b dans l'inégalité des pentes) ;
′ ′
par conséquent, pour x < a fg (a)(x − a) ≥ fd (a)(x − a), et on voit nalement que l'inégalité
f (x) ≥ fd′ (a)(x − a) + f (a) est valide pour tout x ∈ IR. Le même raisonnement s'applique pour
montrer que l'autre inégalité est vraie pour tout x ∈ IR.
Corollaire 3.10. Soit I un intervalle ouvert de IR, alors une fonction convexe f : I → IR est
continue.
Exercice . 3.5 Trouver une fonction convexe f : [0, 1[→ IR qui n'est pas continue en {0}.
Proposition 3.11. Si E = IR et f est dérivable sur un ouvert convexe U ⊂ E (donc un intervalle
ouvert) alors f est convexe si et seulement si f est croissante.
′
Démonstration. ⇒ f
) Supposons
convexe, l'inégalité qu'on a montrée au (2) du théorème précédent
s'écrit (f ′ (u) − f ′ (v))(u − v) ≥ 0 ′ ′ ′
donc (f (u) − f (v)), (u − v) ont même signe et f est croissante.
′ ′ ′ ′
On peut alternativement utilisé pour a < b, f (a) = fd (a) ≤ fg (b) = f (b) grâce à l'inégalité vue au
théorème 3.9.
⇐) Réciproquement si f ′ croissante, montrons que f convexe, on veut voir f (λa + (1 − λ)b) ≤
λf (a)+(1−λ)f (b) pour a < b, λ ∈]0, 1[. Par l'égalité des accroissements nis, la pente f (λa+(1−λ)b)−f
(1−λ)(b−a)
(a)
′ f (b)−f (λa+(1−λ)b) ′
est atteinte par f en un point de ]a, λa + (1 − λ)b[, et de même est atteinte par f
(λ(b−a)
en un point de ]λa + (1 − λ)b, b[ donc par croissance de la dérivée :
43
3 Propriétés diérentielles des fonctions convexes.
3.1 Rappel sur la diérentiabilité (au sens de Fréchet)
On rappelle que pour E, F des e.v.n. l'ensemble des applications linéaires continues L(E, F ) est
un e.v.n. avec la norme d'opérateur (dite aussi norme subordonnée) |||f ||| = sup||x||E ≤1 ||f (x)||F .
Dénition 3.4. Soit E, F des e.v.n., U ⊂ E un ouvert, f : U → F est diérentiable (au sens de
Fréchet) en x si il existe T ∈ L(E, F ) notée df (x) telle que
Dans le cas le plus fréquent pour nous où E = IRn , F = IR, si f est diérentiable, alors elle admet
∂f ∂f
des dérivées partielles, le gradient de f en a est noté ∇f (a) = ( ∂x1
(a), ..., ∂x n
(a)). Alors, on a :
n
X ∂f
df (a)(h) = ⟨∇f (a), h⟩ = (a)hj .
j=1
∂x j
3. Si f est en plus C , f est convexe ssi d f (x) est positive pour tout x ∈ U au sens où
2 2
plus généralement si E est préhilbertien (cf. chapitre 5), si d f (x) est dénie positive, pour
2
tout x ∈ U (c'est-à-dire pour tout h ̸= 0, d f (x)(h, h) > 0) alors f est strictement convexe.
2
44
Remarque . 3.3 (Rappel d'algèbre linéaire) Si E = IRn , alors d2 f (x) est positive si et seulement si
∂2f
la matrice hessienne Hf (x) est positive (rappel (Hf (x))ij = (
∂xi ∂xj
(x))). Comme elle est toujours
symétrique et donc diagonalisable en base orthonormale,
cela
équivaut à ce que ces valeurs propres
r s
soient toutes positives. Dans le cas n = 2 H(f )(x) = (c'est à dire on prend les notations de
s t
∂2f ∂2f ∂2f
Monge r= ∂x2
(x), s = ∂x∂y
(x), t = ∂y 2
(x)) alors H(f )(x) est positive si et seulement si rt − s2 ≥ 0
et r ≥ 0. 1
Remarque . 3.4
2
Un cas particulier du (3) est le cas où il existe c > 0 telle que d f (x)(h, h) ≥ c||h||
n
2
f (v + th) − f (v)
df (v).[u − v] = inf ≤ f (u + h) − f (u) = f (u) − f (v).
t>0 t
Réciproquement on applique l'inégalité en z = tx + (1 − t)y ∈ U par convexité de U pour x, y ∈ U
d'où :
(A) f (x) − f (z) ≥ df (z)[x − z], (B) f (y) − f (z) ≥ df (z)[y − z],
et t(A) + (1 − t)(B) donne
45
Donc ϕ′ est croissante et par un résultat à 1 variable (proposition 3.12) ϕ est convexe.
(3)Si f est C 2 , on dérive en t la relation du (2) avec v = x, u = x + th une fois divisée par t2
2
et on obtient d f (x)(h, h) ≥ 0. Réciproquement, en dérivant en t, la fonction g dénie par g(t) =
df (v + t(u − v))(u − v) (qui est C 1 car df est C 1 ) et en appliquant le théorème fondamental du calcul :
Z 1
[df (u) − df (v)][u − v] = g(1) − g(0) = dtdf (v + t(u − v))(u − v, u − v) ≥ 0
0
Exercice . 3.6 Montrer quef (x) = x4 est strictement convexe sur IR mais que sa dérivée seconde n'est
pas bornée inférieurement par c > 0.
Proposition 3.13. Si f est de classe C sur un ouvert convexe U et f est convexe, alors tout point
1
f (a + th) − f (a)
→t→0+ df (a)(h) ≥ 0
t
f (a − th) − f (a)
→t→0+ df (a)(h) ≤ 0
−t
46
donc df (a)(h) = 0 pour tout h df (a) = 0.
ce qui veut dire
La nouveauté est la réciproque, on suppose f convexe. Il sut de noter par le théorème 3.12 que
pour c ∈ C , f (c) − f (a) ≥ df (a)(c − a) = 0 donc f (a) = inf c∈C f (c) et a atteint l'inmum de f sur
C.
n
On a un critère d'optimisation plus général sur un convexe C ⊂ IR . On rappelle que ∇f (a) =
∂f ∂f
( ∂x1 (a), ..., ∂x (a)).
Soit C un convexe de IR avec C ⊂ U un ouvert et f : U → IR une fonction de
n
Théorème 3.14. n
classe C , convexe sur C . Alors a est un minimum global de f sur C si et seulement si −∇f (a) ∈
1
∀c ∈ C, ⟨∇f (a), c − a⟩ ≥ 0.
f (t(c − a) + a) − f (a)
⟨∇f (a), c − a⟩ = lim+ ≥0
t→0 t
Réciproquement, si l'inégalité est vériée donc on peut utiliser le théorème 3.12 (dont la preuve
du 1 s'applique même si C n'est pas ouvert) et on obtient :
donc f (c) ≥ f (a) pour tout c∈C et donc a est un minimum de f sur C.
Exemple . 3.4 On prend g(c) = ||f − c||22 le carré de la distance euclidienne à f ∈ E. Alors ∇g(a) =
−2(f − a) et donc on obtient que a ∈ C minimise la distance de x à C si et seulement si :
∀c ∈ C, ⟨x − a, c − a⟩ ≤ 0.
Ce sera le critère du théorème de projection sur un convexe fermé C où l'on verra l'existence d'un tel
n
point a au dernier chapitre. Dans IR on peut aussi voir l'existence par compacité de C ∩ B pour une
boule fermée B assez grande pour qu'une inégalité grossière permette d'assurer que tout minimum
doive s'y trouver. On obtient ainsi le résultat suivant.
La preuve suivante par compacité ne fonctionnera pas en dimension innie, mais le résultat sera
encore vrai dans un espace de Hilbert (cf. chapitre 5).
47
Démonstration. Comme C non vide r = inf v∈C ||f − v||2 < ∞. Soit D = C ∩ B(f, r + 1). Comme la
boule fermé est un convexe fermé, D
est un convexe fermé comme intersection de convexes fermés, et
n
il est aussi borné par dénition, donc c'est un compact de IR . De plus, D ⊂ C , donc inf v∈C ||f −v||2 ≤
inf v∈D ||f − v||2 par dénition de l'inmum. Mais soit 1 > ϵ > 0 et v ∈ C tel que ||f − v||2 ≤ r + ϵ
alors par dénition v∈D et donc inf d∈D ||f − d||2 ≤ ||f − v||2 ≤ r + ϵ. Donc en passant à la limite
ϵ → 0, on a obtenu :
inf ||f − v||2 ≤ r = inf ||f − v||2 ≤ inf ||f − v||2 .
v∈D v∈C v∈D
Or v 7→ ||f − v||2 est continue sur le compact D, donc atteint son inmum en u ∈ D ⊂ C . Par
2 2
croissance du carré, c'est aussi le point où ||f −v||2 atteint son inmum. La hessienne de v 7→ ||f −v||2
est l'identité, donc cette application est strictement convexe, elle a donc un unique minimum PC (f ).
La caractérisation du minimum a été vue à l'exemple précédent. Enn cette caractérisation donne
(en retraduisant avec la dénition de NC (c)
Le fait que PC : E → C est une application surjective (vu que PC (c) = c pour c ∈ C) implique le
résultat sur la partition.
On verra au chapitre intégration section 5.2 l'inégalité la plus importante, l'inégalité de Jensen,
p
qu'on appliquera ensuite au chapitre Espace L .
Voici en exercice un cas (très) particulier de l'inégalité de Jensen (cf. Corollaire 5.6 pour une
preuve).
Exercice . 3.8 Soit I un intervalle de IR, α1 , . . . , αn des réels positifs tels que
Pn
i=1 αi = 1, et φ une
fonction convexe sur I. Alors, pour tout x1 , . . . , xn ∈ I on a
n
! n
X X
φ αi xi ≤ αi φ(xi ) .
i=1 i=1
48
Chapitre 4
Le but de ce chapitrDénition et premières propriétése est de donner le cadre pour votre cours
de probabilité du second semestre, en pensant l'espérance comme une intégrale, tout en généralisant
l'intégrale de Riemann et la somme de série vues en L1 ou en L2. Ce seront aussi les 2 exemples
importants uniés dans ce chapitre (qui donnent les exemples des variables aléatoires continues et
discrètes).
On va se concentrer dans ce chapitre sur la construction de l'intégrale et les grands théorèmes
qu'il faut apprendre à utiliser. On verra le minimum des dénitions requises pour formuler cette
construction. Pour cela, on va s'appuyer sur les similarités avec vos cours de probabilités et avec
le chapitre 1. Ce sont des constructions importantes dont la démarche sera reprise par exemple au
semestre prochain pour la construction de l'espérance conditionnelle. On reporte au deux chapitres
suivants les résultats plus techniques dont il est moins important de retenir une idée des preuves.
Dans ce chapitre, le corps est IK = IR ou IK = C.
l Pour l'intégration, on a aussi besoin de la
droite réelle étendue : IR = IR ∪ {−∞, +∞} avec les mêmes conventions qu'au chapitre précédent :
∞+∞=∞ et λ.∞ = ∞ si λ > 0, 0.∞ = 0.
Rappels
0.1 Droite réelle étendue
Rappel . 4.1 La somme x+y avec x, y ∈ IR, est dénie à l'exception du cas où x = ±∞ et y = −x.
Contrairement au cas des limites, on pose 0. + ∞ = 0, t. + ∞ = +∞ pour t > 0.
Pour un ensemble A non-vide (non-nécessairement borné), on utilise sup A pour le plus petit
majorant M ∈ IR de A et inf A pour le plus grand minorant m ∈ IR de A.
On utilisera aussi inf ∅ = +∞, sup ∅ = −∞.
1. M = sup A ssi M est un majorant de A et il existe une suite (xn ), avec xn ∈ A telle que
xn → M . Caractérisation analogue de inf A .
2. Tout A (non-vide) admet une borne supérieur sup A ∈] − ∞, ∞] et une borne inférieur inf A ∈
[−∞, ∞[.
3. sup A et inf A sont uniques.
49
4. sup(−tA) = −t inf A, ∀t ∈]0, ∞[. Formules analogues pour sup(tA), inf(tA), inf(−tA).
5. sup(A + B) = sup A + sup B et inf(A + B) = inf A + inf B (avec la somme usuelle d'ensemble
A + B = {a + b : a ∈ A, b ∈ B}.
6. Si A ⊂ B, alors inf B ≤ inf A ≤ sup A ≤ sup B .
7. Si (xn )n≥0 est une suite croissante de réels, alors lim xn = sup{xn ; n ≥ 0} = sup xn . Énoncé
analogue pour une suite décroissante.
(L'égalité vient de la décroissance de la suite des sup, et c'est aussi la plus grande valeur d'adhé-
rence :exo),
lim inf xn = sup inf xk = lim inf xk .
n n≥1 k≥n n→∞ k≥n
lim sup txn = t lim sup xn , lim inf txn = t lim inf xn
lim sup xn + yn ≤ lim sup xn + lim sup yn
lim inf xn + yn ≥ lim inf xn + lim inf yn
Enn, lim sup x n = lim inf xn = ℓ ∈ IR si et seulement si x n →ℓ .
Démonstration. Toutes les (in)égalités sont des conséquences des propriétés des sup, inf puis un
passage à la limite :
sup −xn = − inf xn , inf −xn = − sup xn
k≥n k≥n k≥n k≥n
Enn, le sens intéressant est celui où lim sup xn = lim inf xn = ℓ ∈ IR et alors Xk = inf k≥n xk ≤
xk ≤ supk≥n xn = Yk et le théorème des gendarmes permet de conclure que la limite commune de
Xk , Yk est aussi la limite ℓ de xk . Réciproquement, si xn → ℓ, alors pour tout ϵ > 0, pour n grand,
ℓ − ϵ ≤ xn ≤ ℓ + ϵ d'où on déduit ℓ − ϵ ≤ lim inf xn ≤ lim sup xn ≤ ℓ + ϵ et ϵ → 0 conclut.
50
1 Tribus, fonctions mesurables et mesures
1.1 Tribus
Vous avez l'habitude de parler d'évènement d'un espace de probabilité et de considérer la famille
T ⊂ P(Ω) des évènements d'un tel espace. Souvent (pour les probabilités discrètes), on peut prendre
T = P(Ω), l'ensemble de toutes les parties de Ω, mais cela ne sera pas possible pour généraliser
l'intégrale de Riemann, on ne pourra pas dénir l'intégrale de n'importe quel ensemble. La dénition
suivante retient donc les propriétés essentielles de la famille des évènements que l'on veut pour dénir
une probabilité sur une telle famille.
Dénition 4.2. Une tribu (ou σ-algèbre) sur Ω est une famille T de partie de Ω, soit T ⊂ P(Ω)
telle que :
1. ∅∈T
2. Si A∈T alors Ac ∈ T .
-mesurable mesurable
n≥1
A∈T T
espace mesurable
Un ensembe est appelée partie ou simplement .
(Ω, T ) Ω T Ω.
ensembles mesurables (pour la tribu T ou T -mesurables).
Un est une paire formée d'un ensemble et d'une tribu sur Les
enembles A∈T sont appelés
n i
n≥1 i=1
Remarque . 4.2 On verra au chapitre suivant la notion plus élémentaire d'algèbre de parties (ou clan)
où l'on demande seulement la stabilité par union nie, mais elle ne sura pas pour la construction
de l'intégrale. Il faut comparer la notion de tribu à celle de topologie de la remarque 2.3, qui était
l'axiomatisation des parties ouvertes d'un espace métrique. Comme une topologie, une tribu est stable
par intersection nie, mais même plus elle est stable par intersection dénombrable. Mais par contre,
elle n'est pas stable par union quelconque, mais seulement par union dénombrable. Donc aucune
des notions n'est plus générale que l'autre. Enn, la nouveauté est la stabilité par complémentaire,
ou autrement dit par toutes les opérations logiques de bases sur les ensembles (complémentaire,
intersection et union binaires), et c'est la clef pour son application en probabilité (on veut aussi
que les évènements soient stables par toutes les opérations logiques). On va cependant traiter dans
beaucoup d'aspect la notion de tribu comme la famille des ouverts d'un espace métrique (ou plus
généralement topologique).
51
1.2 Mesure et Probabilité sur une tribu
L'intégation va dépendre d'un objet de base qui permet la mesure du volume" (ou en physique la
mesure de la masse" ou d'autres grandeurs extensives) et qui va généraliser la notion de probabilité.
1. µ(∅) = 0
2. (σ -additivité) Pour toute suite au plus dénombrable (Ai )i∈I 1 d'éléments de T deux à deux
disjoints,
[ X
µ( Ai ) = µ(Ai ).
i∈I i∈I
Une mesure a des propriétés très similaires à celle d'une probabilité dont vous avez l'habitude
(exo).
n n≥1
[
µ( An ) = lim µ(An ) = sup µ(An ).
n→∞ n≥1
n≥1
1. c'est à dire soit I = [[0, n]] et dans ce cas i∈I µ(Ai ) = ni=0 µ(Ai ), soit soit I = IN et dans ce cas i∈I µ(Ai ) =
P P P
52
Exercice . 4.2 Montrer que le seul ensemble ν -négligeable pour la mesure de comptage ν est l'ensemble
vide.
Lemme 4.5. Si (T ) est une famille de tribus, alors T T est une tribu. On peut donc parler
de la plus petite tribu contenant une famille A ⊂ P(Ω), qui est l'intersection de toutes les tribus
i i∈I i∈I i
Démonstration.
T ∅∈T
C'est une conséquence directe de la forme de la dénition. i i pour tout , donc
∅∈ i∈I Ti .
c
T
De plus, siA ∈ i∈IT Ti , alors A ∈ Ti pour tout i, donc comme Ti est une tribu, A ∈ Ti pour
c
chaque i et donc A ∈ i∈I Ti . T
Enn, si pour chaque n ≥ 1, An ∈
S STi , alors A
i∈I Tn ∈ Ti pour tout i, donc comme Ti est une
tribu, n≥0 An ∈ Ti pour chaque i et donc n≥1 An ∈ i∈I Ti .
Exemple . 4.2 (cf. TD) Si A ⊂ Ω, la tribu engendrée par A est σ({A}) = {A, Ac , ∅, Ω}.
Exemple . 4.3 (cf. TD) Si A1 , · · · , An ⊂ Ω forment une partition (c'est à dire sont 2 à 2 disjoints et
d'union Ω), la tribu engendrée σ({A1 , · · · , An }) = {∪i∈I Ai : I ⊂ [[1, n]]}.
B(IR ) = σ ]a , b [, a < b ∈ IR
Y n
n
i i i i
i=1
53
Lemme 4.7. (cf TD.) Sur IR , la tribu borélienne a les diérents systèmes de générateurs :
n
B(IR ) = σ ] − ∞, b ], b ∈ IR
Y n
n
i i
i=1
IR
Yn
=σ [ai , +∞[, ai ∈
i=1
IR
Yn
=σ [ai , bi ], ai < bi ∈
i=1
IR
n
= σ F : F fermé de
Exemple 4.5 (Mesure discrète sur Ω ni) . Sur tout ensemble dénombrable Ω = {ωn , n ∈ [[1, n]]}, pour
(µi ) ∈ [0, +∞[n on dénit sur P(Ω) : X
µ(A) = µi .
ωi ∈A
P(Ω).
famille sommable
C'est une mesure sur Une fois connue l'intégration pour la mesure de comptage (ou de façon
équivalente si on connaît la notion de , on pourra généraliser cet exemple au cas Ω
dénombrable)
Enn, l'exemple fondamental est le théorème donnant l'existence de la mesure de Lebesgue (ad-
mis)
2. au sens ou pour tout a ∈ IRd , B ∈ B(IRd ), si on note a + B = {a + b, b ∈ B}, alors λ(a + B) = Λ(B)
54
Cette mesure est appelée mesure de Lebesgue sur IR et notée λ ≡ λ et elle vérie pour a < b :
d
d i i
n
Y n
Y Yn
λ [ai , bi ] = λ ]ai , bi [ = (bi − ai ).
i=1 i=1 i=1
Proposition 4.10. (dénissant la mesure image) Soit f : Ω → (E, B)une fonction et (Ω, σ(f ), µ)
un espace mesuré alors la formule µ (B) = µ(f (B)) for B ∈ B est une mesure sur T , appelée
f −1
Démonstration. µ
Pour voir que
f
B µ (∅) = µ(∅) = 0
est une mesure sur , il faut noter
f
. Puis pour la
σ -additivité, pour Ai ∈ B, i ∈ I deux à deux disjoints avec I au plus dénombrable, on a :
[ [ [ X X
−1 −1
µ f
Ai = µ f Ai =µ f (Ai ) = µ(f −1 (Ai )) = µf (Ai ),
i∈I i∈I i∈I i∈I i∈I
vu que les f −1 (Ai ) ∈ σ(f ) sont aussi deux à deux disjoints par (1.1), on a pu utilisé à l'avant-dernière
égalité la σ -additivité de µ.
Dénition 4.7.
−1
Une fonction f : (Ω, T ) → (E, B) entre espaces mesurables est
−1
mesurable
si
f (B) ⊂ T pour tout B ∈ B , f (B) ∈ T . Si (Ω, T ) = (X, B(X), (E, B) = (Y, B(Y )),
fonction borélienne
c'est à dire si
on appelle une fonction mesurable f : (X, B(X)) → (Y, B(Y )).
Proposition 4.12. Soit f : Ω → (E, B) une fonction, la tribu engendrée par f du lemme 4.8
σ(f ) := f −1 (B) = {f −1 (B), B ∈ B} est la plus petite tribu rendant f mesurable. Autrement dit : Si
T ⊂ P(Ω) est une tribu, f : (Ω, T ) → (E, B) est mesurable si et seulement si σ(f ) ⊂ T .
Démonstration. σ(f ) est une tribu. f : (Ω, σ(f )) → (E, B) est mesurable
On a vu au lemme 4.8 que
par dénition, car pour tout B ∈ B,f −1 (B) ∈ σ(f ) par dénition de σ(f ), et cela veut dire
on a
f : (Ω, σ(f )) → (E, B) est mesurable par dénition de la mesurabilité. L'équivalence f : (Ω, T ) →
(E, B) est mesurable si et seulement si σ(f ) ⊂ T vient aussi directement des deux mêmes dénitions.
L'inclusion σ(f ) ⊂ T dit justement que σ(f ) est plus petite (pour l'inclusion) que toute tribu rendant
f mesurable.
55
Exemple .
4.6 Si A ∈ T , la fonction indicatrice 1A : (Ω, T ) → (IR, B(IR)) est mesurable, car σ(1A ) =
σ({A}) = {A, Ac , ∅, Ω} par l'exemple 4.2 et donc σ(1A ) ⊂ T par la dénition d'une tribu.
En pratique, on a besoin d'une description en terme de parties génératrices :
Lemme 4.13. Une fonction f : (Ω, T ) → (E, σ(A)), vers un espace mesurable engendré par une
famille A, est mesurable si et seulement si f (A) ⊂ T c'est à dire si pour tout A ∈ A, f (A) ∈ T .
−1 −1
Démonstration. f Si A ⊂ σ(A)
mesurable, vu que f (A) ∈ T , le fait que
−1
est une conséquence
directe de la dénition. Le contenu du lemme est donc la réciproque.
On introduit une fammille B (qui va se révéler être la plus grande tribu de E rendant f mesurable,
la preuve est donc très similaire à celle sur σ(f )) :
B = {B ∈ P(E) : f −1 (B) ∈ T }.
f (F ) ∈ T ). En particulier, si (Ω, T ) = (X, B(X)) pour un espace métrique X , alors, toute fonction
−1
f −1 (F ) est fermé) donc dans B(X) pour tout ouvert U de Y, on déduit que la continuité implique
la mesurabilité.
En composant, avec les produits et sommes qui sont des applications continues, on obtient les
mêmes stabilités algébriques que pour les fonctions continues :
Corollaire 4.15. Les fonctions mesurables (Ω, T ) → IR sont stables par combinaisons linéaires,
produits, fractions rationnelles à dénominateur non nulle, passage à l'exponentielle (etc.)
On tire de même immédiatement des lemmes 4.6 et 4.7 :
Corollaire 4.16. Une fonction f = (f , · · · , f ) : (Ω, T ) → (IR , B(IR )) est mesurable si et seule-
n n
56
4. Pour tout a < b , · · · , a < b ∈ IR, f
n
Y
−1
1 1 n n ]ai , bi [ ∈ T .
1 n
Corollaire 4.17. Une fonction f : (Ω, T ) → (R, B(R)) (à valeur dans l'espace métrique (IR, dIR ) de
l'exemple 2.5) est mesurable si et seulement si les trois assertions suivantes sont vériées :
1. f ({∞}) ∈ T
−1
2. f ({−∞}) ∈ T
−1
Cette hypothèse est par exemple vériée quand µ(Ω) < +∞ (donc en particulier quand µ est une
n
mesure de probabilité), quand Ω= IN muni de la mesure de comptage, ou quand Ω = IR muni de
la mesure de Lebesgue.
On renvoie à l'annexe C en section 1.3 pour une preuve d'un corollaire très classique au lemme
de classe monotone pour les mesures dans le cas des mesures σ -nies.
Corollaire 4.19. (au lemme de classe monotone) Soient µ et ν des mesures sur un espace mesurable
. Soit une famille stable par intersection nie qui engendre T . Si µ et ν coïncident sur E
(Ω, T ) E
(i.e. µ(E) = ν(E), ∀E ∈ E ) et si il existe une suite de parties A ∈ E telle que Ω = ∪ A et
alors et ν sont égales (i.e. µ(B) = ν(B), ∀B ∈ T ).
n n n
µ(An ) = ν(An ) < +∞ µ
57
Dénition 4.9. Pour A, B ∈ T , l'intégrale de 1 sur B par rapport à µ
A est notée et dénie par :
Z Z
f dµ ≡ 1A (ω)dµ(ω) = µ(A ∩ B).
B B
Les combinaisons linéaires de fonctions indicatrices (mesurables) vont donc être de même la base
de l'intégrale de Lebesgue :
Dénition 4.10. Soit (Ω, T ) un espace mesurable, on appelle fonction étagée f : (Ω, T ) → IR d
une
fonction de la forme
n
X
f (ω) = ai 1Ai (ω)
i=1
pour
d
ai ∈ IR et Ai ∈ T . Pour d = 1, la représentation est dite canonique si a1 < · · · < a n , tous non
nuls (∀i, ai ̸= 0) et les A1 , · · · , An sont deux à deux disjoints et non vides.
Exercice . 4.4 Les fonctions étagées sur (Ω, T ) forment un sous espace vectoriel des fonctions Ω → IRd .
Comme on veut que l'intégrale soit linéaire, on est conduit à la dénition suivante :
n
Dénition 4.11. Soit f
X
une fonction étagée positive f (ω) = ai 1Ai (ω) avec Ai ∈ T des ensembles
On reporte à l'annexe C section 4.2 la preuve facile mais fastidieuse du lemme suivant :
Lemme 4.20. Soit (Ω,RT , µ) un Respace mesuré, et f, h : (Ω, T ) → [0, +∞] étagées positives, B ∈ T :
1. Si f ≥ 0, alors f dµR= 1 f dµR.
2. Si f ≥ 0, c >R 0, alors cfR dµ = c R f dµ.
B Ω B
B B
Lemme 4.21. Soit (Ω, T ) un espace mesurable. Toute fonction mesurable positive f : (Ω, T ) →
(IR, B(IR)) est limite simple d'une suite croissante de fonctions étagées positives.
Démonstration. On prend
k k
n −1
4X
2n
si
2n n
≤ f (x) < k+1
2n
,0 ≤ k < 4n
k
4 −1+1
fn (x) = 2n 1{x:f (x)=+∞} + 1 −1 k k+1 (x) = 0 si
2n
n
= 2 ≤ f (x) < +∞ ≤ f (x).
2n f ([ 2n , 2n [) n
k=0 2 si f (x) = +∞
58
0 ≤ fn ≤ fm pour n ≤ m. Sur f −1 ([0, 2n ]), on découpe chaque intervalle
2. La suite est croissante
m−n k
de dénition de fn en 2 ensembles dans la dénitions de fm . Si fm (x) = m ≤ f (x) <
2
k+1
2m
, 0 ≤ k < 2m+n , on trouve k = κ2m−n + l pour 0 ≤ l < 2m−n , 0 ≤ κ < 4n par division
euclidienne et
κ k κ l κ l+1 l+1
fn (x) = ≤ f m (x) = = + ≤ f (x) < + ≤ f n (x) +
2n 2m 2n 2m 2n 2m 2m
Sur f −1 (]2n , +∞[) on a fn (x) = 0 ≤ fm (x). Vu fn (x) ≤ f (x) ≤ fn (x) + 1
2n
on en déduit
f (x) − 21n ≤ fn (x) ≤ f (x) si f (x) ≤ 2n , on déduit la convergence simple.
Remarque .
B B B
4.3 Pour la mesure de comptage ν sur I, toute suite a : I → [0, +∞] est mesurable
positive et l'intégrale correspond à la dénition de la somme d'une famille sommable :
Z ( )
X X
f dν = ai = sup aj : J ⊂ I, fini .
I i∈I j∈J
Remarque
R R . 4.4 Si f est étagée positive, pour chaque g≤f étagée positive, on a vu au lemme 4.20,
B
gdµ ≤ B
f dµ donc
Z nZ o
f dµ ≥ sup gdµ : g étagée, 0 ≤ g ≤ f .
B B
Et comme f fait parti des g du sup, on a en fait égalité, et la valeur de la dénition du cas étagé
positif coïncide avec la nouvelle valeure.
Lemme 4.22. Soit (Ω, T , µ) un espace mesuré, et f, h : (Ω, T ) → [0, +∞] mesurable positive,
A, B ∈ T :
1. (monotonie) Si R0 ≤ f ≤ hR alors 0 ≤ R f dµ ≤ R hdµ.
2. Si f ≥ 0, alors f dµR= 1 f dµR. En particulier, pour A ⊂ B, 0 ≤ R f dµ ≤ R f dµ.
B B
B B B
La dernière propriété n'est pas optimale, nous verrons l'additivité en utilisant le théorème de
convergence monotone. Nous la mentionnons ici pour signaler que l'additivité n'est pas évidente à
partir de la dénition.
59
3.2 Théorème de convergence monotone de Beppo Levi
Théorème 4.23. (Théorème de convergence monotone ou TCM) Soit Z : (Ω, T ) → [0, +∞], une
suite croissante de fonctions mesurables positives qui tend simplement vers Z . Alors Z est mesurable
n
et pour tout B ∈ T : Z Z Z
lim Zn dµ = Zdµ ≡ lim Zn dµ.
n→∞ B B B n→∞
Démonstration. La mesurabilité de
R
Z vient du théorème 4.18. Posons α = supn B Zn dµ.
Comme Zn ≤ Zm ≤ Z pour n ≤ m, la monotonie de l'intégrale (du lemme 4.22) montre que
Z Z Z
Zn dµ ≤ Zm dµ ≤ Zdµ
B B B
R
Donc, comme la suite
B
Zn dµ est croissante, elle converge vers son sup et :
Z Z
lim Zn dµ = α ≤ Zdµ.
n→∞ B B
Z Z Z m
X
Zn dµ ≥ Zn 1An dµ ≥ (1 − ϵ) g1An dµ = (1 − ϵ) bi µ(Bi ∩ An ∩ B). (4.1)
B B B i=1
[
Remarquons nalement que An = Ω vu que pour tout ω ∈ Ω, Zn (ω) → Z(Ω) > Z(ω) − ϵZ(ω).
n≥0
Comme Zn est croissante, An est aussi croissante donc par la proposition 4.3,
[
µ(Bi ∩ An ∩ B) → µ( Bi ∩ An ∩ B) = µ(Bi ∩ B).
n
m
X Z
α ≥ (1 − ϵ) bi µ(Bi ∩ B) = (1 − ϵ) gdµ
i=1 B
R
soit en passant au sup sur g≤Z puis à la limite ϵ → 0, on obtient l'inégalité voulue α≥ B
Zdµ.
R
On obtient un résultat concret d'approximation pour
B
f dµ.
Corollaire 4.24. RSoit fmesurable positive. Pour toute suite croissante de fonctions étagées telle
que f → f , on a f dµ → f dµ.
n B n
R
B
Corollaire 4.25. (Linéarité de l'intégrale : cas positif) Soient f, g mesurables positives et α, β > 0,
on a : Z Z Z
αf + βgdµ = α f dµ + β gdµ.
B B B
60
Démonstration. Par le lemme 4.21, on a des suites croissantes de fonctions étagées fn → f, gn → g
donc αfn + βgn est une suite croissante de fonctions étagées et αfn + βgn → αf + βg. Par le TCM
ou le corollaire précédent, en passant à la limite dans l'égalité du lemme 4.20 :
Z Z Z Z Z Z
αfn + βgn dµ = α fn dµ + β gn dµ → αf + βgdµ = α f dµ + β gdµ.
B B B B B B
Corollaire 4.26. (Interversion Série-intégraleX: cas positif) Soient f : Ω → [0, +∞] une suite de
fonctions mesurables positives alors la somme f : Ω → [0, +∞] est mesurable et on a pour tout
n
B∈T :
n≥0
Z X XZ
fn dµ = fn dµ.
B n≥0 n≥0 B
Z Z Z Z Z
lim inf Xn dµ = lim Zm dµ = sup Zm dµ ≤ sup inf Xn dµ ≡ lim inf Xn dµ.
B n→∞ m→∞ B m B m n≥m B n→∞ B
Remarque . f : (Ω, T ) → (IR, B(IR)) une fonction mesurable, sa est f+ = partie positive
partie négative
4.5 Soit
max(f, 0) et sa est f− = max(−f, 0). f+ , f− et la valeur absolue |f | sont mesurables
par composée de f avec des applications continues. Elles vérient f = f+ − f− et |f | = f+ + f− .
61
De même, pour f : (Ω, T ) → (C l , B(C
l )) une fonction mesurable, son module |f |, et ses parties
réelles et imaginaires Re(f ), Im(f ) sont mesurables et
Dénition 4.13. (Ω, T , µ) un espace mesuré, une fonction mesurable f : (Ω, T ) → IR) est
intégrale par rapport à sur
Soit
Z Z Z
f dµ = f+ dµ − f− dµ.
B B B
Dénition 4.14. Soit (Ω, T , µ) un espace mesuré, une fonction mesurable f : (Ω, T ) → C
intégrale par rapport à sur
l (resp.
f = (f1 , · · · , fn ) : (Ω, T ) → IRn )) est µ B ∈ T si ses parties réelles et
imaginaire Re f, Im f : (Ω, T ) → IR (resp. ses coordonnées fi ) sont intégrables sur B , i.e. de façon
Z
équivalente si |f |dµ < +∞. On note L1 (Ω, T , µ; C
l) l'ensemble des fonctions intégrables à valeur
B
C.
l
On pose alors :
Z Z Z Z Z Z
f dµ = Re f dµ + i Im f dµ ∈ C
l, (resp. f dµ = f1 dµ, · · · , fn dµ ∈ IRn )
B B B B B B
R R R R R
L'équivalence vient de
B
| Re f |dµ, B
| Im f |dµ ≤ B
|f |dµ ≤ B
| Re f |dµ + B
| Im f |dµ.
Lemme 4.29. Soit (Ω, T , µ) un espace mesuré, et f, g : (Ω, T ) → IK des fonctions intégrables sur
B ∈ T , alors
1. 1 f est intégrable sur Ω et R f dµ = R 1 f dµ.
2. (linéarité) Si α, β ∈ IK alors αf + βg est intégrable sur B et
B B Ω B
Z Z Z
αf + βgdµ = α f dµ + β gdµ.
B B B
RDémonstration.
R
1. Vu |1B f | = 1B |f |, |1 f |dµ =
en utilisant le cas positif du lemme 4.22, on a
Ω B
B
|f |dµ < +∞ d'où l'intégrabilité. Le calcul de l'intégral se déduit alors du même résultat en prenant
partie positive et négative des parties réelles et imaginaires.
2. Par l'inégalité triangulaire |αf + βg| ≤ |α||f | + |β||g|, donc en passant à l'intégrale et utilisant
le cas positif de la linéarité de l'intégrale (Corollaire 4.25) :
Z Z Z Z
|αf + βg|dµ ≤ |α||f | + |β||g|dµ = |α| |f |dµ + |β| |g|dµ < +∞.
B B B B
De même, l'égalité des intégrales vient en prenant partie positive et négative des parties réelles et
imaginaires.
R R
3. Il sut d'utiliser la monotonie de l'intégrale
B B
|h|dµ ≤ |f |dµ < +∞.
4. Dans le cas réel, on a utilise juste l'inégalité triangulaire :
Z Z Z Z Z Z
f dµ = f+ dµ − f− dµ ≤ f+ dµ + f− dµ = |f |dµ.
B B B B B B
alors on a :
n
1. ZR est intégrable
2. |Z − Z|dµ → 0
3. on peut intervertir limite et intégrale
Ω n
Z Z Z
lim Zn dµ = Zdµ = lim Zn dµ.
n→∞ Ω Ω A n→∞
L'hypothèse 2. se formule en disant que Zn converge vers Z presque partout. On étudiera cette
notion avec plus de détail au chapitre suivant.
63
Démonstration. En appliquant aux parties réelles et imaginaires, il sut de montrer le cas IK = IR.
1. L'inégalité |Zn | ≤ Y
implique en passant à la limite |Z| ≤ Y sur A, ou autrement dit par
c
domination, Z est intégrable sur A. Comme µ(A ) = 0, on a aussi |Z| ≤ Y + ∞1Ac et Y + ∞1Ac est
aussi intégrable, donc Z est même intégrable.
3. L'inégalité |Zn | ≤ Y se traduit aussi par Y − Zn , Zn + Y ≥ 0 et on peut appliquer le lemme de
Fatou 4.27 :
Z Z Z Z Z
(Y − Z)dµ = lim inf (Y − Zn )dµ ≤ lim inf (Y − Zn )dµ = Y dµ − lim sup Zn dµ,
A A n n A A n A
Z Z Z Z Z
(Y + Z)dµ = lim inf (Y + Zn )dµ ≤ lim inf (Y + Zn )dµ = Y dµ + lim inf Zn dµ,
A A n n A A n A
donc en soustrayant le terme en Y,
Z Z Z Z
Zdµ ≤ lim inf Zn dµ ≤ lim sup Zn dµ ≤ Zdµ
A n n A
et on en déduit donc l'égalité et la dernière convergence.
2. Enn, par l'inégalité triangulaire, on déduit |Zn − Z| ≤ |Zn | + |Z| ≤ 2Y sur A et il satisfait
la même condition de domination et pour tout
R R ω ∈ A, |Zn − Z|(ω) → 0. En appliquant le reste du
résultat, on obtient donc
Ω
|Zn − Z|dµ → Ω 0dµ = 0
Corollaire 4.31. (InterversionXSérie-intégrale : cas général) Soient f : ΩX→ IK une suite de n
fonctions mesurables telle que |f |dµ < ∞ pour B ∈ T , alors la somme f : Ω → IK existe
Z
n n
Z X XZ
fn dµ = fn dµ.
B n≥0 n≥0 B
5 Théorème de transfert
Théorème 4.32 Soit f : (Ω, T , µ) → (E, E ) une fonction mesurable de
.
mesure image µ et h : (E, E ) → (IR, B(IR)) une autre fonction mesurable. Alors, si h est à valeur
(Théorème de transfert)
positive :
f
Z Z
(h ◦ f ) dµ = h(x) dµf (x).
64
Autrement dit, on ramène une intégrale sur Ω à une intégrale sur IR :
Z Z
h(f (ω))dµ(ω) = h(x)dµf (x).
Ω IR
Par linéarité, on obtient le cas de h étagé. Si h positive, h est la limite croissante d'une suite de fonc-
tions étagées hn (du lemme 4.21). Comme hn (x) → h(x) par construction, on applique le théorème
de convergence monotone aux deux mesures :
Z Z Z Z
h ◦ f dµ = lim (hn ◦ f )dµ = lim hn (x)dµf (x) = h(x)dµf (x).
n→∞ n→∞
Le dernier résultat du cas intégrable est évident par le cas positif pour l'équivalence et par linéarité
pour l'égalité.
Le résultat similaire suivant est important en probabilité. Nous avons vu la tribu engendrée par
f : σ(f ) au lemme 4.8. Le résultat suivant donne une interprétation concrète des fonctions σ(f )-
mesurables.
Proposition 4.33 (Lemme de Doob-Dynkin). Soit f une fonction mesurable, f : (Ω, T , µ) → (E, E ),
et soit σ(f ) = {A = f (B), B ∈ E } la tribu engendrée par f . Alors g : Ω → (IR , B(IR )) est σ(f )-
−1 n n
Proof : La condition susante est évidente car pour un borélien A, (h ◦ f )−1 (A) = f −1 (h−1 (A))
qui est mesurable car h (A) ∈ E
−1
car h borélienne et l'image inverse par f est alors par dénition
un élément de σ(f ). P
Réciproquement, on raisonne comme pour le transfert par le cas étagé g = i λi 1Ai et Ai =
f −1 (Bi ) et alors h = i λi 1Bi convient. Sinon, si g positive, on la prend pour limite simple de
P
gn
étagée de la forme hn ◦ f par le cas étagé, et on pose
h convient car mesurable positive (comme lim inf de fonctions mesurables) et car g(ω) = limn hn (f (ω)) =
h(f (ω)) vu qu'en f (ω) la suite (hn ) converge d'après le choix de gn . Le cas général se montre par
linéarité à partir du cas positif.
65
donc par combinaison linéaire, intégrale de Riemann et de Lebesgue par rapport à la mesure de
Lebesgue coïncident.
Soit f continue par morceau sur [a, b], l'intégrale de Riemann est construite en choisissant fn en
escalier convergent uniformément vers f et donc simplement, donc f est borélienne comme limite
simple de fonctions boréliennes (cf. le théorème 4.18). De plus, elle est bornée donc intégrable sur
[a, b].
Quitte à décomposé en partie réelle et imaginaire, on suppose f réelle. DOnc pour tout x ∈ [a, b]
on a |f (x) − fn (x)| ≤ ||fn − f ||∞ soit
En intégrant au sens de Lebesgue, et en utilisant que les deux côtés coïncident avec celle de
Riemann, on obtient l'inégalité :
Z b Z Z b
fn (x)dx − ||fn − f ||∞ (b − a) ≤ f dλ ≤ fn (x)dx + ||fn − f ||∞ (b − a).
a [a,b] a
Rb Rb
En passant à la limite n → ∞, on a ||fn − f ||∞ → 0 et
a
fn (x)dx → a
f (x)dx par dénition de
l'intégrale de Riemann. On a donc obtenu :
Théorème 4.34. 1. Toute fonction continue par morceau sur un segment [a, b] est intégrable
par rapport à la mesure de Lebesgue λ et son intégrale de Riemann coïncide avec celle pour la
mesure de Lebesgue : Z Z b
f (x)dx = f dλ.
a [a,b]
2. Toute fonction continue par morceau sur un intervalle I (]a, b], ]a, b[ ou [a, b[) est
intégrable par rapport à la mesure Rde Lebesgue Rλ et son intégrale de Riemann coïncide avec
intégrable
On pourra donc appliquer les théorèmes précédents aux intégrales (de Riemann) usuelles vues en L2.
Remarque . 4.6 Pour les fonctions f : [a, b] → IR, on peut dénir une notion plus générale de fonc-
tion Riemann intégrable", elle même plus générale que l'intégrale des fonctions continues par mor-
http://math.
ceaux. L'intégrale de Lebesgue généralise aussi cette version plus générale, cf. e.g.
univ-lyon1.fr/homes-www/mironescu/resources/cours_mesure_integration.pdf section 6.8.1
Proposition 4.35 (Mesures à densité (ou absolument continue)). Soit f : X → [0, +∞] une fonction
mesurable. On dénit une application ν : A → [0, +∞] par
Z
ν(A) = f dµ .
A
Alors, ν est une mesure sur X , appelée f par rapport à µ. De plus h est intégrable
par rapport à ν si et seulement si f h est intégrable par rapport à µ et :
mesure de densité
Z Z
hdν = f hdµ .
X X
66
Pour une mesure à densité ν par rapport à µ, si µ(A) = 0 alors ν(A) = 0. En fait, cette
propriété caractérise les mesures à densité (c'est un théorème beaucoup plus dur, le théorème de
Radon-Nikodym cf. section 5)
Exemple . 4.7 On peut dénir une mesure de probabilité sur les boréliens de IR en posant
Z
1 x2
µ(A) = √ e− 2 dλ(x) .
2π A
Cette mesure s'appelle la mesure gaussienne . C'est un exemple de probabilité à densité par rapport
à la mesure de Lebesgue. Pour vérier qu'il s'agit bien d'une probabilité, il faut vérier que :
Z
1 x2
µ(IR) = √ e− 2 dλ(x) = 1.
2π IR
Cas Ω = IN
1. Si f ≥ 0 alors f dν = f (n)
Z ∞
Lemme 4.36.
X
Z ∞
X
f dν = f (n).
Ω n=0
Démonstration.
n
X
1) Soit fn = f (k)1{k} est une suite croissante de fonctions donc par le TCM
k=1
Z Z n
X ∞
X
f dν = lim fn dν = lim f (k) = f (n)
Ω n Ω n
k=0 n=0
∞
X
2) L'équivalence vient du 1) f est intégrable ssi |f | a une intégrale ni, donc ssi |f (n)| c'est
P n=0
à dire ssi f (n) est absolument convergente. La dénition de l'intégrale et de la somme coïncident
alors
Z Z Z ∞
X ∞
X ∞
X
f dν = f+ dν − f− dν = f (n)+ − f (n)− = f (n).
Ω Ω Ω n=0 n=0 n=0
67
Cas Ω = {ωn , n ∈ IN} dénombrable
On a ω : IN →Ω une bijection, donc la mesure image νω ({i}) = ν({ω −1 (i)} = 1 = ν({i}) est
encore la mesure de comptage, le théorème de transfert donne donc :
IN f (ω)dν = f (ω )
X
f dν = n
Ω n=0
valide pour les séries absolument convergentes (on dit qu'elles sont n=0
.) n=0
Aussi L (Ω, ν) = ℓ (Ω) est l'ensemble des familles sommables sur Ω avec la norme 1.
commutativement convergentes
1 1
Dénition 4.16. Soit f : A × Ω → IK. On suppose que pour tout x ∈ A, t 7→ f (x, t) est intégrable
(soit dans L1R(Ω, T , µ)). Dans ce cas, on peut poser :
F (x) = Ω f (x, t)dµ(t). On dénit ainsi une intégrale dépendant d'un paramètre la fonction
F : A → IK.
que
+
Z Z
lim f (xn , t)dµ(t) = f (x0 , t)dµ(t).
n→∞ Ω Ω
68
Exemple . f : → λ).
transformée de Fourier
4.8 (cf TD.) Soit IR C
l intégrable sur IR (par rapport à la mesure de Lebesgue
Sa est dénie par :
Z
fˆ(x) = f (t)eitx dt.
IR
On suppose :
1. Pour tout x ∈ U , t 7→ f (x, t), est intégrable sur Ω.
2. Il existe N avec µ(N ) = 0, tel que pour tout t ∈ N , la fonction x 7→ f (x, t) admet une i-ème
c
∂f
∀t ∈ N, ∀x ∈ K, (x, t) ≤ gK (t).
∂xi
Alors la fonction x 7→ F (x) = R f (x, t)dµ(t) admet une i-ème dérivée partielle sur U , ∂f
∈ L1 (Ω)
et : Ω ∂xi
Z
∂F ∂f
(x) = (x, t)dµ(t).
∂xi Ω ∂xi
Remarque . 4.7 Soitf = (f1 , ..., fm ) : U × Ω → IRm avec U ⊂ IRn un ouvert. Si chaque fi (x, .) est
intégrable sur Ω pour tout x ∈ U , on peut dénir l'intégrale coordonnée par coordonnée :
Z Z Z
f (x, t)dµ(t) = ( f1 (x, t)dµ(t), · · · , fn (x, t)dµ(t)).
Ω Ω Ω
Alors le théorème s'applique en remplaçant la valeur absolue par la norme dans la domination (et en
appliquant le résultat coordonnée par coordonnée.)
Démonstration. On peut supposer n = m = 1 (car les dérivées partielles se calculent coordonnée par
c
coordonnée). On xe x0 et montre la dérivabilité en x0 . On pose h(x, t) = 0 si t ∈ N et pour t ∈ N
f (x, t) − f (x0 , t) ∂f
h(x, t) = , si x ̸= x0 et h(x0 , t) = (x0 , t).
x − x0 ∂x
Pour x ̸= x0 ,
F (x) − F (x0 )
Z
= h(x, t)dµ(t).
x − x0 Ω
R
Il sut donc de prouver que x 7→ h(x, t)dµ(t) est continue en x0 . Par hypothèse, t 7→ h(x, t)
Ω
est mesurable pour x ̸= x0 et par exemple en tant que lim inf (sur N ) aussi ex x0 et x 7→ h(x, t) est
continue pour t ∈ N (par continuité d'une fonction dérivable d'une variable). Enn l'inégalité des
accroissements nis à x 7→ f (x, t) donne, pour x ̸= x0 , x ∈ K = [x0 − ϵ, x0 + ϵ] ⊂ U (un compact car
fermé borné de IR contenu dans U pour ϵ assez petit) :
∂f
||h(x, t)|| ≤ sup (u, t) ≤ gK (t).
u∈[x0 ,x] ∂xi
69
La même inégalité étant évidente en x0 , on a la condition de domination et le théorème de continuité
appliqué à K conclut.
des ouverts, une fonction C (k ∈ IN × {∞}). Soit µ une mesure sur une tribu T ⊃ B(V ).
k
On suppose qu'il existe ϕ , ϕ , ..., ϕ µ-intégrables sur V telles que ||f (x, t)|| ≤ ϕ (t) et
0 1 k 0
∂ pf
∀(i1 , ..., in ), i1 + ... + in = p ≤ k, ∀x ∈ U, ∀t ∈ I (x, t) ≤ ϕp (t).
∂xi11 ...∂xinn
Alors la fonction x 7→ F (x) = R f (x, t)dµ(t)
V
est de classe sur et pour p = i + ... + i
Ck U 1 n ≤k :
∂ pF ∂ pf
Z
(x) = (x, t)dµ(t).
∂xi11 ...∂xinn i1 in
V ∂x1 ...∂xn
On verra plus tard grâce à l'inégalité de Cauchy-Schwarz qu'il sut de supposer x2i intégrable. On
reprend la transformée de Fourier vu en TD et à l'exemple 4.8 qui est dénie par :
Z Z
i⟨ξ,x⟩
µ̂(ξ) = n
e dµ(x) = f (ξ, x)dµ(x), f (ξ, x) = ei⟨ξ,x⟩ .
IR IR
2n
f est C2 (même C ∞) sur IR et vérie les dominations :
|f (ξ, x)| ≤ 1
∂ ∂
f (ξ, x) = ixi ei⟨ξ,x⟩ , f (ξ, x) ≤ |xi |
∂ξi ∂ξi
∂2 ∂2
f (ξ, x) = −xi xj ei⟨ξ,x⟩ , f (ξ, x) ≤ |xi xj |
∂ξi ∂ξj ∂ξi ∂ξj
et par l'hypothèse µ de masse nie, 1 est intégrable et par les hypothèses d'intégrabilité, les autres
membres de droite des dominations sont intégrables aussi par rapport à µ. Par le théorème de
2
dérivation avec condition de domination, on déduit donc que µ̂ est C et :
∂2
Z Z
∂ i⟨ξ,x⟩
µ̂(ξ) = i xi e dµ(x) µ̂(ξ) = − xi xj ei⟨ξ,x⟩ dµ(x).
∂ξi IR
n
∂ξi ∂ξj IR
n
n
Cet exemple sera utilisé au S6 pour montrer le Théorème centrale limite dans IR .
70
Chapitre 5
Changements de variables
Dénition 5.1. (X, A, µ1 ) et (Y, B, µ2 ) deux espaces mesurés σ -nis. On note A ⊗ B la tribu
tribu produit
Soient
engendrée par les parties de la forme A × B , où A ∈ A, B ∈ B ; on l'appelle des tribus
A et B.
(Z, D) sont mesurables, l'application (f, g) : (X ×Y, A⊗B) → (Z ×T, C ⊗D) dénie par (f, g)(x, y) =
(f (x), g(y)) est mesurable.
Démonstration.
Vu {E × F, E ∈ E, F ∈ F} ⊂ A ⊗ B , on obtient en passant à la tribu engendrée
G := σ {E × F, E ∈ E, F ∈ F} ⊂ A ⊗ B .
′ ′
Réciproquement, on pose A = {A ∈ A : ∀F ∈ F, A × F ∈ G}. On a clairement que A contient
E et on vérie facilement que c'est une tribu (vu que Ac × F = (Ω × F ) − (A × F ) ∈ G pour F ∈ F .)
′ ′
D'où A = σ(E) = A. De même, on pose ensuite, B = {B ∈ B : ∀A ∈ A, A × B ∈ G} et on déduit
′ ′ ′
du point précédent que F ⊂ B ⊂ B et comme avant que B est une tribu d'où B = B . Finalement,
on a donc A × B ⊂ G d'où l'inclusion complémentaire de tribus.
n+m
Le cas particulier B(IR ) = B(IRn )⊗B(IRm) est une conséquence immédiate
du Corollaire 4.16.
71
1.2 Mesure produit
Théorème 5.2 Soient (Ω , T , µ ) et (Ω , T , µ ) deux espaces me-
.
surés σ-nis. Alors il existe une unique mesure ν sur T ⊗ T vériant
(dénissant la mesure produit) 1 1 1 2 2 2
1 2
Exemple . λ 5.1 Si
n
λ = λ ⊗λ
n désigne la mesure de Lebesgue sur IR , alors on a toujours n+m n m . On
applique le corollaire 4.19 au lemme de classe monotone à l'ensemble des pavés E . Par dénition,
λn+m , λn ⊗ λm coïncident sur les pavés. Or ∪M ∈IN [−M, M ]n+m = Rn+m et λn+m ([−M, M ]n+m ) =
(2M )n+m = (λn ⊗ λm )([−M, M ]n+m ) < +∞ donc on conclut à l'égalité voulue.
La preuve va être basée sur le fait de montrer un cas particulier du théorème de Fubini suivant
pour les fonctions indicatrices.
72
1.3 Théorème de Fubini-Tonelli et Fubini (admis)
La mesure produit µ1 ⊗ µ2 µ1 et µ2 , on s'attend à ce qu'il en soit de même
étant dénie à partir de
1
de l'intégrale d'une fonction mesurable relativement à µ1 ⊗ µ2 . Et c'est eectivement le contenu des
théorèmes de Fubini. On commence par le cas positif.
Théorème 5.3 (FubiniTonelli). Soient (Ω1 , T1 , µ1 ) et (Ω2 , T2 , µ2 ) deux espaces mesurés σ-nis. Soit
f : Ω1 × Ω2 → [0, +∞] une fonction T ⊗ T -mesurable. Alors :
1. y 7→ Zf (x, y) est une fonction mesurable (sur (Ω , T ) dans [0, +∞] ) pour tout x ∈ Ω , et
1 2
2 2 1
2. x 7→Zf (x, y) est une fonction mesurable (sur (Ω , T ) dans [0, +∞]) pour tout y ∈ Ω , et
Ω2
1 1 2
3. On a
Ω1
Z Z Z Z Z
f (x, y)dµ1 ⊗µ2 (x, y) = f (x, y)dµ2 (y) dµ1 (x) = f (x, y)dµ1 (x) dµ2 (y) .
Ω1 ×Ω2 Ω1 Ω2 Ω2 Ω1
3. On a
2
Z Z Z Z Z
f (x, y)dµ1 ⊗µ2 (x, y) = f (x, y)dµ2 (y) dµ1 (x) = f (x, y)dµ1 (x) dµ2 (y) .
Ω1 ×Ω2 Ω1 Ω2 Ω2 Ω1
Exercice . 5.2 Soit f, g des fonctions mesurables positives sur IR, on dénit la convolution de f, g par :
Z
f ∗ g(x) = f (x − y)g(y)dλ(y) ∈ [0, ∞].
IR
On rappelle que Z
||f ||1 = |f (x)|dλ(x).
IR
1. Montrer que f ∗g est mesurable et que
73
2. Montrer que la dénition de f ∗g s'étend pour presque tout x au f, g ∈ L1 (IR, dλ) et que
f ∗ g ∈ L1 (IR, dλ).
3. Montrer que pour f, g, h toutes mesurables positives ou toutes intégrables, alors
f ∗ (g ∗ h) = (f ∗ g) ∗ h.
φ gdµ ≤ φ ◦ gdµ
X X
74
Le corollaire suivant est un cas (très) particulier de l'inégalité de Jensen, qui peut se montrer
élémentairement, sans théorie de la mesure.
Corollaire 5.6. Soit I un intervalle de IR, α , . . . , α des réels positifs tels que P n
αi = 1 , et φ
une fonction convexe sur I . Alors, pour tout x , . . . , x ∈ I on a
1 n i=1
1 n
n
! n
X X
φ αi xi ≤ αi φ(xi ) .
i=1 i=1
Démonstration. On xe x1 , . . . , x n ∈ I
et on considère l'espace mesuré d'ensemble sous-jacent X =
{x1 , . . . , xn }, où toutes les parties sont mesurables et µ = ni=1 αi δxi , où δxi désigne la mesure de
P
Dirac en xi . Alors µ est une mesure de probabilité ; de plus pour toute fonction g : X → IR on a
Z n
X
gdµ = αi g(xi ) .
X i=1
Z n
X Z
En considérant pour g la fonction identité, on a donc φ ◦ gdµ = αi φ(xi ), et gdµ =
X i=1 X
n
X
αi xi . L'inégalité de Jensen nous donne donc comme attendu
i=1
n
! n
X X
φ αi xi ≤ αi φ(xi ) .
i=1 i=1
diéomorphismes de classe
On énonce le théorème dans le cadre le plus courant où les fonctions que l'on peut utiliser pour faire
un changement de variables sont les C 1.
Théorème 5.7. (admis) La mesure de Lebesgue sur R est invariante par translation, au sens où
n
Inversement, si µ est une mesure sur (R , B(IR )) nie sur les parties bornées et invariante par
n n
n n
75
Exercice . 5.3 On cherche à montrer l'unicité. On pose c = µ([0, 1[n ). Montrer en utilisant des recou-
vrements par des translations d'un ensemble xé que
1. µ([0, m1 [n ) = c m1n
2. pour a1 , ..., an ≥ 0, on a
n Qn
Y ⌊mai⌋ ⌊mai⌋
µ( [0, [) = c i=1 n
i=1
m m
Lemme 5.8. Soit b ∈ IR et A ∈ M (IR) une matrice inversible. On pose f (x) = Ax + b avec
n
Exercice . 5.4 Si A n'est pas inversible montrer que λ(f (B)) = 0. (Indication : on pourra montrer
que f (B) est inclus dans un hyperplan ane, i.e. un sous-espace ane de dimension n − 1, dans le
cas b = 0 dans un s.e.v. de dimension n − 1).
Démonstration. f (B) = (f −1 −1
) (B) est bien borélien car f −1 est linéaire (en dimension nie donc)
−1
continue donc borélienne. De même λ(f (·)) = f .λ est la mesure image par f −1 donc c'est bien une
mesure nie sur les parties bornées (car f (B) est borné pour tout borné B , cf chapitre 3 f (B(0, M )) ⊂
B(0, ||b|| + M |||f |||) avec |||f ||| la norme subordonnée de f ). Montrons qu'elle est invariante par
translation.
a ∈ IRn λn (f (a+B)) = λn (b+A(a+B)) = λn (Aa+f (B)) = λn (f (B)) par invariance par
On a pour
translation de la mesure de Lebesgue. Le théorème précédent montre donc que λn (f (B)) = cλn (B)
pour tout borélien B . Il sut donc de bien choisir le borélien pour chaque A pour montrer que
c = |det(A)|.
Par décomposition polaire, une matrice réelle s'écrit A = OS avec O orthogonale et S symétrique.
t
Cette matrice S peut se diagonaliser en base orthogonale S = O2 DO2 donc, ensemble, cela donne
t
une décomposition A = O1 DO2 où O1 = OO2 , O2 sont orthogonales et D est diagonale réelle.
Comme λn est invariante par translation, on est donc ramené au cas b = 0.
On est donc ramener au deux cas A orthogonale et A diagonale inversible.
Si A orthogonale, alors on choisit la boule unité euclidienne B = Bn car une matrice orthogonale
laisse invariante cette boule (c'est par dénition une isométrie pour la norme euclidienne) donc
λn (f (Bn )) = λn (Bn ) et c = 1 = |det(A)| (vu AAt = I , det(A)2 = det(A)det(A t
) = det(I) = 1).
n
Q n
Si A = diag(d1 , ..., dn ) alors on prend B = [0, 1] car A(B) = i=1 [0, di ] avec [0, di ] = [di , 0] si
di < 0. Dans tous les cas λn (A(B)) = ni=1 |di | = |det(A)|λ(B) comme voulu.
Q
Dans le cas général, A = O1 SO2 , par composition, on obtient :
76
Proposition 5.9. Soit f : U → V un diéomorphisme, alors ∀x ∈ U , df (x) : IR n
→ IR est un
p
Remarque . 5.2 1. Le résultat précédent montre que la dimension est invariante par diéomor-
n p
phisme. De même des ouverts de IR et IR ne peuvent être homéomorphes que si n = p mais
c'est beaucoup plus dur (Théorème d'invariance du domaine de Brouwer). Par contre, il existe
2
des applications continues surjectives de [0, 1] dans [0, 1] .
∂fi
(J(f )(x))ij = ( (x)).
∂xj
Remarque . 5.3 Le théorème de dérivation des fonctions composées donne donc :
Théorème 5.10. (d'inversion globale) Soit f : U → IRn une application de classe C k (avec k ≥ 1)
injective et telle que pour tout x ∈ U , df (x) : IR → IR est un isomorphisme linéaire, alors f (U )
n n
Remarque . df (x)
5.4 det(Jf (x)) ̸= 0.
est un isomorphisme si et seulement si
IR . Alors on a :
n
n
77
1. Pour toute partie B borélienne de U , λ (φ(B)) = .
Z
n | det(Jφ(x))|dλn (x)
Z Z
f (x)dλn (x) = f ◦ φ(y)| det(Jφ(y))|dλn (y) .
V U
Remarque . −1
5.5 Le cas ane est une conséquence du lemme 5.8 et du théorème de transfert appliqué
f =φ : (V, B(V ), λn ) → (U, B(U )). Le 1 du théorème ou le lemme 5.8 ci-dessus, s'interprète comme
le calcul de la mesure image de la mesure de Lebesgue induite sur V : (λn,V )X ayant une densité
fX (x) = | det(Jφ(x))|1U (x) par rapport à λn . Le résultat correspond à h = f ◦ φ de sorte que :
Z Z Z Z
f dλn = h(X)dλn = n
h(y)fX (y)dλn (y) = f ◦ φ(y)| det(Jφ(y))|dλn (y).
V V IR U
Exemple
2
.
5.2 (changement de variables en polaires) On considère l'application ϕ : U =]0, +∞[×]0, 2π[→
IR ϕ(r, θ) = (r cos θ, r sin θ).
dénie par
cos θ −r sin θ
Alors, la matrice jacobienne de ϕ est , de déterminant r .
sin θ r cos θ
2
De plus, ϕ est injective et ϕ(U ) = IR \ ([0, +∞[×{0}) = V .
1 2 2
Ainsi, ϕ est un C -diéomorphisme de U sur V . Comme λ2 (IR \ V ) = 0, c'est-à-dire IR \ V est
2
négligeable, il n'est pas gênant que ϕ ne soit pas un diéomorphisme de U sur IR tout entier.
Par exemple, calculons
Z
I= (x + y)2 dxdy , où D = {(x, y) : x2 + y 2 < 1}.
D
En utilisant le théorème de changement de variables avec les coordonnées polaires (et le théorème de
−1
Fubini), on obtient ϕ (D ∩ V ) =]0, 1[×]0, 2π[ et
Z
I = (x + y)2 dxdy
ZD∩V
= (r cos θ + r sin θ)2 rdrdθ
ϕ−1 (D∩V )
Z 1 Z 2π
3 2 2
= r (cos θ + sin θ + 2 cos θ sin θ)dθ dr
0 0
Z 1 Z 2π
3
= r (1 + sin 2θ)dθ dr
0 0
Z 1
= 2πr3 dr
0
π
= .
2
78
Exemple .5.3 Calculons Γ( 12 ) =
0
R +∞
t−1/2 e−t dt.
On commence par le changement de variable (pour les intégrales à une variable) u2 = t, dt = 2udu :
Z +∞ Z +∞ Z +∞
1 −1/2 −t −u2 2
Γ( ) = t e dt = 2 e du = e−u du
2 0 0 −∞
2
avec la dernière égalité venant de la parité de la fonction u 7→ e−u .
Enn, on calcule le carré de cette intégrale en utilisant d'abord Fubini-Tonelli pour obtenir une
2 c
intégrale double (on utilise IR \ ({0} × [0, +∞[) = V vériant λ2 (V ) = 0 comme à l'exemple
précédent).
Z +∞ Z +∞ Z Z
1 −x2 −y 2 −x2 −y 2 2 −y 2
(Γ( ))2 = dx dy e = dxdy e = dxdy e−x
2 −∞ −∞ IR
2
V
d'où par changement de variable en coordonnée polaire (comme à l'exemple précédent on utilise
ϕ−1 (V ) = U pour le domaine d'intégration) :
Z 2π Z +∞ Z 2π h
1 −r2 2
i+∞ 1
(Γ( ))2 = dθ dre 2r/2 = dθ1 −e−r /2 = (2π). = π.
2 0 0 0 0 2
Z +∞ √
1 2 /2
√ e−x dx = π. (5.1)
2 −∞
79
Chapitre 6
Soit (Ω, T , µ) un espace mesuré (Tla tribu, µ la mesure). On va travailler en identiant les
fonctions si elles coïncident µ-presque partout. Autrement dit, on écrira f = g quand µ({x : f (x) ̸=
g(x)}) = 0 ; en particulier, f = 0 signiera que f vaut 0 presque partout. Par exemple, si f est la
l on pourra écrire f = 0. Ainsi, dit en mots, on va en fait travailler avec
fonction caractéristique de Q,
les classes d'équivalence de fonctions à égalité µ-presque partout près". IK sera égale à IR ou C.
l
1 L'espace L∞(Ω, µ)
Dénition 6.1. Soit f : Ω → IK M ∈ [0, +∞[ est une borne
essentielle essentiellement bornée
une fonction mesurable. On dit que
def ou que f est par M si µ({x : |f (x)| > M }) = 0, autrement
dit, si f ≤ M µ-presque partout.
Lemme 6.1. (L∞ (Ω, T , µ; IK), || · ||∞ ) est un espace vectoriel normé.
Démonstration. On montre qu'il s'agit d'un sous-espace vectoriel de l'espace des classes d'équiva-
lences de fonctions mesurables. Bien sûr 0 est bornée donc essentiellement bornée.
∞
Soient f, g ∈ L (Ω, T , µ; IK), λ ∈ IK. Par l'exo
Or par l'inégalité triangulaire des nombres on a :|(λf + g)(ω)| ≤ |λ||f (ω)| + |g(ω)| donc {ω :
|f (ω)| ≤ ||f ||∞ } ∩ {ω : |g(ω)| ≤ ||g||∞ } ⊂ {ω : |(λf + g)(ω)| ≤ |λ|||f ||∞ + ||g||∞ } et en passant au
complémentaire
80
µ({ω : |(λf + g)(ω)| > |λ|||f ||∞ + ||g||∞ }) ≤ µ({ω : |f (ω)| > ||f ||∞ }) + µ({ω : |g(ω)| > ||g||∞ }) = 0
Donc, par dénition, λf + g est essentiellement bornée et ||λf + g||∞ ≤ |λ|||f ||∞ + ||g||∞ . On
déduit queL∞ (Ω; IK) est bien un espace vectoriel et l'inégalité triangulaire. En fait µ({ω : |f (ω)| >
C}) = µ({ω : |λf (ω)| > |λ|C}) donc en comparant les inma, ||λf ||∞ = |λ| ||f ||∞ ce qui donne la
positive homogénéité. Enn par dénition, si ||f ||∞ = 0 alors f = 0 presque partout donc sa classe
d'équivalence est nulle.
1
sup |fp (ω) − fq (ω)| ≤ .
ω∈An,p,q n
On va intersecter tous ces ensembles (une intersection dénombrable) pour avoir µ-p.p. une suite
∩p,q≥Nn An,p,q . On a µ(Ac ) ≤ n>0 p,q≥Nn µ(Acn,p,q ) = 0 (vu
P P
de Cauchy. On prend donc A = ∩n>0
c
que A est une union dénombrable).
c
De plus pour ω ∈ A , on a
1
∀n, ∀p, q ≥ Nn , |fp (ω) − fq (ω)| ≤
n
donc (fn (ω)) est de Cauchy dans IK donc converge. Sa limite est forcément f (ω) et en passant à la
limite q → ∞ ci dessus, pour tout ω ∈ A :
1
∀n, ∀p ≥ Nn , |fp (ω) − f (ω)| ≤ .
n
Comme µ(Ac ) = 0 on déduit
1
∀n, ∀p ≥ Nn , ||fp − f ||∞ ≤ .
n
Ceci implique ||f ||∞ ≤ ||fp ||∞ +||fp −f ||∞ donc f est dans L∞ (Ω, T , µ; IK) et la convergence de fn vers
f dans cet espace. Comme toute suite de Cauchy converge, on a obtenu la complétude voulue.
81
n'est pas une norme (mais une seminorme sur Lp (Ω, T , µ) car si ||f ||p = 0 alors f est seulement nulle
presque partout. On considère donc l'espace des classes d'équivalences à égalité presque partout près
de fonctions f˙ et l'espace de Lebesgue :
Dénition 6.2.
Z
L (Ω, T , µ; IK) = {f˙; f : Ω → IK
p
mesurable et |f |p dµ < ∞},
Proposition 6.3. Si f , g sont mesurables, ∥f ∥ < +∞ et ∥g∥ < +∞ , alors f g ∈ L (Ω, T , µ; IK)
p
et ∥f g∥ ≤ ∥f ∥ ∥g∥ .
p ∞
p p ∞
Démonstration. µ
Il sut de noter que, -presque partout, on a |g(x)| ≤ ∥g∥∞ , et donc |f (x)g(x)|p ≤
|f (x)|p ∥g∥p∞ . En intégrant cette inégalité, on obtient bien
Z Z
∥f g∥pp = p
|f (x)g(x)| dµ ≤ |f (x)|p ∥g∥p∞ dµ = ∥f ∥pp ∥g∥p∞ .
Ω Ω
Lemme 6.4 (inégalité de Hölder). Si p, q ∈ [1, ∞[ tels que 1/p+1/q = 1/r ≤ 1, f ∈ Lp (Ω, T , µ; IK), g ∈
Lq (Ω, T , µ; IK) alors f g ∈ L (Ω, T , µ; IK) et
r
|f (x)|p |g(x)|q
|f (x)g(x)| ≤ + .
p q
Donc en intégrant, on obtient f g ∈ L1 et appliquant à λf , λ > 0 :
λp−1 λ−1
||f g||1 ≤ ||f ||pp + ||g||qq .
p q
Comme le cas d'annulation ||f ||p = 0 ou ||g||q = 0 sont évidents (car alors f g = 0 µ − p.p.),
on conclut en supposant ||f ||p ̸= 0, ||g||q ̸= 0 et en prenant la valeur de λ donnant le minimum
q/p
λ = ||f ||−1
p ||g||q .
82
Une conséquence importante est l'exercice suivant :
et ∥f + g∥ ≤ ∥f ∥ .
(Inégalité de Minkowski)
p p + ∥g∥p
p p
1 1 1 1 1 1
f (x) + g(x) ≤ f (x) + g(x) ≤ |f (x)|p + |g(x)|p .
2 2 2 2 2 2
1 1
p
∥f + g∥pp ≤ (∥f ∥pp + ∥g∥pp )) .
2 2
Ceci nous prouve que ∥f + g∥p < +∞.
p
Maintenant, notons q = l'exposant conjugué de p. Ci-dessous, on va utiliser l'inégalité de
p−1
Hölder, et le fait que
Z 1q Z 1− p1
p−1 (p−1)q p
|f + g| q
= |f + g| dµ = |f + g| = ∥f + g∥p−1
p .
Ω Ω
Alors on a
Z
∥f + g∥pp = |f + g|p dµ
ZΩ
≤ (|f | + |g|)|f + g|p−1 dµ
ZΩ Z
= |f ||f + g| dµ + |g||f + g|p−1 dµ
p−1
Ω Ω
p−1
≤ ∥f ∥p |f + g| q
+ ∥g∥p |f + g|p−1 q
p−1
= (∥f ∥p + ∥g∥p ) |f + g| q
= (∥f ∥p + ∥g∥p )∥f + g∥pp−1
Si jamais ∥f + g∥p = 0 on n'a rien à démontrer ; sinon, en divisant des deux côtés par ∥f + g∥p−1
p on
obtient nalement ∥f + g∥p ≤ ∥f ∥p + ∥g∥p .
Exercice . 6.3 Soit (Ω, T , µ) un espace mesure σ -ni. Soit f ≥ 0 une fonction mesurable positive,
alors pour p ∈]0, ∞[ Z Z ∞
p
f dµ = dtptp−1 µ({ω : f (ω) > t}).
0
83
On rappelle d'abord la version Lp du théorème de convergence dominée.
domination |f | ≤ g avec g ∈ L (Ω, µ). Alors, f , f ∈ L (Ω, µ) et f converge vers f dans L (Ω, µ),
n
p p p
c'est à dire.
n n n
et comme g ∈ Lp (Ω, µ) et positive, on déduit que g p = |g|p est µ-intégrable et sert donc de domination
pour appliquer le théorème de convergence dominée usuelle qui donne le résultat :
Z Z
||fn − f ||pp = p
|fn − f | dµ →n→∞ 0dµ = 0.
Ω Ω
Théorème 6.7 . Soit (Ω, µ) un espace mesuré, les espaces L (Ω, µ, IK) pour p ∈p
Théorème 6.8. Soient (Ω, T , µ) un espace mesuré, p ∈ [1, +∞[, et (f ) une suite d'éléments de
L (Ω) qui converge vers f dans (L (Ω), ∥ · ∥ ). Alors il existe une suite extraite (f ) telle que (f )
n
p p
Démonstration. p
(f )
On extrait nk ||f − f || ≤ 1/2 .
telle que nk+1 nk p
k
k
(c'est possible car la suite est de
Cauchy dans donc on prend nk telle que ||fq − fnk ||p ≤ 1/2 pour q ≥ nk .)
L Pn
Donc on pose gn = k=1 |fnk+1 − fnk | qui est une suite croissante avec
X ∞
X
||gk ||p ≤ ||fnk+1 − fnk ||p ≤ 1/2k = 1.
k k=1
84
c
P
Donc k (fnk+1 − fnk ) est absolument convergente sur A = {ω : g(ω) < ∞} et on a µ(A ) = 0,
vu ||g||p < ∞. Donc par série télescopique (fnk (ω)) converge pour ω ∈ A. (et comme suite extraite
p p
elle converge aussi dans L mais en fait elle est dominée par |fn0 | + g ∈ L et converge aussi par
convergence dominée).
Proposition 6.9. Soient (Ω, T , µ) un espace de probabilité et f : Ω → [0, +∞] une fonction mesu-
rable. Alors on a
∥f ∥∞ = lim ∥f ∥p .
p→+∞
Z p1
1
p
∥f ∥p = |f | dµ ≤ (∥f ∥p∞ µ(Ω)) p = ∥f ∥∞ .
Ω
1 1
∥f ∥p ≥ (tp µ(At )) p = tµ(At ) p → t quand p → +∞ .
Ceci montre que si ∥f ∥∞ = +∞ alors ∥f ∥p tend vers +∞ ; mais aussi que, si ∥f ∥∞ < +∞ on a pour
tout ε>0 que pour p susamment grand ∥f ∥∞ − ε ≤ ∥f ∥p ≤ ∥f ∥∞ .
Lemme 6.10. Soit (Ω, µ, T ) un espace σ-ni. L'ensemble S des fonctions étagées intégrables est
dense dans tous les L (Ω, µ, T ), 1 ≤ p < ∞. En particulier, L (Ω, µ, T ) ∩ L (Ω, µ, T ) est dense dans
p 1 ∞
Lemme 6.11. Soit (Ω, µ, T ) un espace σ-ni avec T = σ(E) pour E une famille stable par inter-
section nie et de mesure nie pour µ, et contenant une suite A avec µ(A ) < ∞ et Ω = ∪ A .
Alors l'espace vectoriel E = V ect{1 , A ∈ E} est dense dans tous les L (Ω, µ, T ), 1 ≤ p < ∞. En
n n n n
p
En général L∞ (Ω, µ, T ) n'est PAS séparable, sauf si Ω est un ensemble ni, par exemple ℓ∞ (IN)
n'est pas séparable (c'est un exercice plus dur de niveau M1).
85
Le lemme de classe monotone implique M ⊃ T (E). Donc si B ∈ T (E) est de mesure nie, on a
Lp
1B∩An ∈ E et par la même application du théorème de convergence dominée (par 1B cette fois) on
Lp Lp
déduit 1B ∈ E . Donc E contient toute fonction étagée intégrable et le résultat précédent conclut.
La séparabilité vient de la densité de l'ensemble dénombrable V ectQ
l
(1A , A ∈ E).
n
Le support d'une fonction continue f est le fermé supp(f ) = f −1 ({0})c .
Un fonction sur IR est
0
donc à support compact quand elle est nulle en dehors d'un ensemble borné. On note Cc (Ω) est
l'ensemble des fonctions à support compact sur un ouvert Ω.
Théorème 6.12. Soit Ω ⊂ IR un ouvert et λ la mesure de Lebesgue sur la tribu borélienne B(Ω) =
n
B(IR ) (tribu induite sur Ω). Alors l'ensemble des fonctions continues à support compact C (Ω) est
n 0
Démonstration. E = {A =
Par le lemme précédent avec
Q n
[a , b ], a ≤ b }
i=1 i i i i l'ensemble des pavés,
il sut de voir que les 1A sont approchés par des fonctions continues à support compact pour
A = ni=1 [ai , bi ]. Par produit de fonctions (de variables diérentes), cela se ramène au cas n = 1. Soit
Q
f = 1[a,b] et fn (t) = 1 si t ∈ [a, b], fn (t) = 1 − max(n(t − b), 1) si t > b, fn (t) = 1 − max(n(a − t), 1)
0
si t < a. Alors il est facile de voir que (fn )n≥1 est une suite dans Cc (Ω) qui converge ponctuellement
p
vers f (exo). Elle est dominée par 1[a−1,b+1] qui est dans L (Ω, B(Ω), λ) pour 1 ≤ p < ∞ donc par
convergence dominée, ||fn − f ||p → 0. Donc on peut appliquer le lemme précédent et conclure.
( )
X
sup aj : J ⊂ I, fini <∞
j∈J
et alors on note ( )
X X
ai = sup aj : J ⊂ I, fini .
i∈I j∈J
Tout d'abord, le résultat simple suivant ramène au cas I dénombrable, ce que l'on supposera
souvent par la suite :
Exercice . 6.4 Si (ai )i∈I est une famille sommable, alors le support I0 = {i ∈ I : ai ̸= 0} est au plus
dénombrable.
Dénition 6.4. Soit p ∈ [1, ∞[. Une famille (zi )i∈I de nombres complexes ou réels est dite de p-
sommable si la famille (|zi |p )i∈I est sommable. On note ℓp (I, IK) l'ensemble des familles d'éléments
de IK p-sommable.
Un examen de la dénition indique que ℓp (I, IK) = Lp (I, P(I), ν) avec ν la mesure de comptage,
c'est donc un espace de Banach. On a aussi par dénition (dans le cas positif puis le cas quelconque) :
X Z
ai = adν.
i∈I I
86
On note
!1/p
X
||z||p = |zi |p .
i∈I
L'inégalité de Hölder s'écrit donc pour x ∈ ℓq (I), y ∈ ℓp (I) : avec 1/p + 1/q = 1, p, q ∈]1, ∞[ :
!1/q !1/p
X X X
xi yi ≤ |xi |q |yi |p
i∈I i∈I i∈I
Théorème 6.13. (de sommation par paquets, cas positif) Soit (Iλ )λ∈Λ une partition de I . Une famille
est sommable si et seulement si on a à la fois les deux propriétés suivantes :
(ai )i∈I
1. pour chaque λ ∈ Λ, (a ) est sommable, disons de somme σ
2. et (σ ) est sommable.
i i∈Iλ λ
De plus, on a l'égalité :
λ λ∈Λ
!
X X X X
ai = σλ ≡ ai .
i∈I λ∈Λ λ∈Λ i∈Iλ
X
1I = 1Iλ .
λ∈Λ
Par le cas positif de l'interversion série intégrale (aussi conséquence du Théorème de Fubini-Tonelli),
on a égalité dans [0, +∞] :
Z Z X !
X XZ XZ X X
ai = adν = 1Iλ adν = 1Iλ adν = adν = ai .
i∈I I I λ∈Λ λ∈Λ I λ∈Λ Iλ λ∈Λ i∈Iλ
Maintenant, la sommabilité correspond à la nitude des sommes rencontrées, ce qui donne l'équiva-
lence.
Corollaire 6.14. Soit (a ) une famille de nombres positifs, alors la formule, pour A ⊂ I :
i i∈I
X
µ(A) = ai ,
i∈A
87
Chapitre 7
1 Généralités
Soit H un espace vectoriel sur IK = IR ou C
l
⟨., .⟩ : H × H → IK
telle que :
On remarque que dans le cas complexe, ⟨., y⟩ est antilinéaire, c'est-à-dire avec λ le conjugué
complexe,
l , ⟨λx + z, y⟩ = λ⟨x, y⟩ + ⟨z, y⟩.
∀x, y, z ∈ H, λ ∈ C
Exemple . 7.1 Sur H = ℓ2 (IN, C 2
l ) := L (IN, ν; C
l) (espace L2 avec la mesure de comptage ν) on a le
produit scalaire (hermitien canonique) :
X
⟨x, y⟩ = xi y i
i∈I
88
Exemple . 7.3 Sur H = C 0 ([a, b], C
l) on a le produit scalaire :
Z b
⟨f, g⟩ = f (x)g(x)dx).
a
avec égalité si et seulement si x, y sont liés. De plus ||x|| = p⟨x, x⟩ est une norme sur H vériant
l'identité du parallélogramme :
2 2
x+y x−y 1
+ = (||x||2 + ||y||2 ).
2 2 2
Démonstration. On a
c'est un polynôme de degré 2 qui est toujours positif ou nul, donc son discriminant ∆ = 4 Re(⟨x, y⟩)2 −
⟨x,y⟩
4||x||2 ||y||2 ≤ 0. En remplaçant y par uy avec u= |⟨x,y⟩|
si ⟨x, y⟩ =
̸ 0 on obtient
Re(⟨x, y⟩u) = |⟨x, y⟩| ≤ ||x||2 ⟨uy, uy⟩ = ||x||2 ||y||2 uu = ||x||2 ||y||2 .
qui vaut 0 si on choisit u tel que ⟨x, y⟩u = |⟨x, y⟩| et que l'on est dans le cas d'égalité de C-S, ce qui
donne la relation de dépendance linéaire cherchée ||y||x − u||x||y = 0. (La réciproque, c'est à dire
l'égalité en cas de dépendance linéaire, est évidente).
Pour vérier que l'on a une norme, la positivité vient de l'axiome 3, la séparation vient du dernier
axiome, l'homogénéité vient de
soit en faisant la somme (avec l'égalité débutant le calcul pour l'inégalité triangulaire), on obtient
l'identité du parallélogramme.
89
Une autre identité importante s'établit en prenant la diérence des égalités donnant la preuve de
l'identité du parallélogramme ci-dessus, c'est l'identité de polarisation :
Théorème 7.2. Soit (Ω, T , µ) un espace mesuré. Alors H = L (Ω, T , µ; IK) est un espace de Hilbert
2
Démonstration. 1
On ne traite que le cas IK = C.
l Si f, g ∈ H , l'inégalité de Hölder avec p=q =2
donne f g ∈ L (Ω, T , µ; IK) et donc l'intégrale dénissant le produit scalaire est bien dénie. On
vérie les axiomes des produits scalaires : 1/ ⟨f, g⟩ est linéaire en la deuxième variable g par linéarité
de l'intégrale.
2/ la symétrie hermitienne vient du calcul suivant :
Z Z Z
⟨f, g⟩ = f gdµ = f gdµ = f gdµ = ⟨g, f ⟩.
Ω Ω Ω
3/
Z
⟨f, f ⟩ = |f |2 dµ = ||f ||22 ∈ [0, +∞[
Ω
Exemple . ℓ (
0
7.4
2
IN; C
l ) sont des espaces de Hilbert (cf. chapitre 6 pour la complétude), mais pas
C ([a, b], C
l) dont la complétion est l'espace de Hilbert L2 ([a, b], λ; C
l ). La complétion d'un espace
préhilbertien en tant qu'e.v.n. (cf. annexe A section 3) est toujours un espace de Hilbert.
90
2 Projection sur un convexe fermé
On va généraliser l'existence de projection orthogonale sur un sous-espace d'un espace euclidien
d'abord au cas des convexes fermés et en dimension innie.
Théorème 7.3. Soit H un espace de Hilbert et C ⊂ H un convexe fermé non-vide. Pour tout f ∈ H
il existe un unique u = P (f ) ∈ C tel que
C
2 2
vn + vm vn − vm 1
f− + = (||f − vn ||2 + ||f − vm ||2 ) → d2 .
2 2 2
vn +vm vn +vm 2
Or par convexité
2
∈C donc f− 2
≥ d2 donc
2
vn − vm 1
≤ (||f − vn ||2 + ||f − vm ||2 ) − d2 → 0.
2 2
On déduit donc que vn est de Cauchy, donc converge vers u et par continuité de la norme d=
||f − u||.
2
Soit g : v 7→ ||f − v||2 . On peut calculer la diérentielle dg(u) = Re(⟨f − u, .⟩). Or si g atteint
son minimum en u, pour v ∈ C , t ∈ [0, 1],
||f − tv − (1 − t)u||22 = ||f − u||22 + t2 ||v − u||22 − 2t Re(⟨f − u, v − u⟩) ≥ ||f − u||22
donc2 Re(⟨f − u, t − u⟩) ≤ t||v − u||22 et la limite t → 0 donne l'inégalité caractéristique. Récipro-
quement, on a en t = 1, l'inégalité qui conclut :
Pour voir l'unicité, si u1 , u2 ∈ C , on peut utiliser la convexité stricte sous la forme de l'identité
du parallélogramme, on a
2 2
u1 + u2 u1 − u2 1
f− + = (||f − u1 ||2 + ||f − u2 ||2 ) = d2
2 2 2
91
u1 +u2 2 2
soit comme f− 2
≥ d2 on déduit u1 −u
2
2
≤ 0 donc u1 = u2 .
Par l'unicité, PC est bien dénie et il ne reste qu'à voir la lipschitizianité. En appliquant la
propriété caractéristique pour f1 , f2 :
||PC (f2 ) − PC (f1 )||2 ≤ Re(⟨f1 − f2 , PC (f2 ) − PC (f1 )⟩) ≤ ||f1 − f2 || ||PC (f2 ) − PC (f1 )||.
Théorème 7.4. Soit H un espace de Hilbert et K ⊂ H un sous espace vectoriel fermé. Pour tout
f ∈ H , il existe un unique u = P (f ) ∈ K tel que
K
F ⊥ = {x ∈ H, ∀y ∈ F, ⟨x, y⟩ = 0}
92
On dit que x est orthogonal à F x ∈ F ⊥ . On remarque que
si
\
F⊥ = (⟨y, ·⟩)−1 ({0})
y∈F
est toujours un sous-espace fermé comme intersection de sous-espaces fermé, comme image inverse
d'un sous-espace fermé par une application linéaire continue (le produit scalaire). La proposition
suivante décrit la décomposition en somme directe orthogonale. Tout se passe comme en dimension
nie pour les sous-espaces fermés, et sinon, il faut ajouter une adhérence.
Démonstration. ⊥
1. On remarque d'abord que F ⊂ F ⊥⊥ .
En eet par dénition de F
⊥
⊥
si x ∈
F, y ∈ F , ⟨x, y⟩ = 0 et donc comme c'est pour tout y ∈ F la dénition du biorthogonal
⊥⊥
donne x ∈ F .
2. On remarque ensuite que F ⊥⊥ ∩ F ⊥ = {0}. En eet, si x ∈ F ⊥⊥ ∩ F ⊥ alors ⟨x, x⟩ = 0 donc
x=0 (par l'axiome de séparation).
3. Montrons ensuite que pF ⊥ = 1 − pF (les projections sont bien dénies car on a des sous-
espaces fermés l'espace de Hilbert H donc on peut utiliser le théorème de projection). En
eet, si y ∈ H la relation caractéristique de la projection othogonale dit que y − pF (y) est
orthogonal à F donc dans F ⊥ et comme y − (y − pF (y)) = pF (y) est orthogonal à F ⊥ , on doit
avoir y − pF (y) = pF ⊥ (y) par caractérisation de la projection.
4. On en déduit la somme H = F + F⊥ (par l'inclusion du 1 et l'intersection du 2, on sait que
cette somme doit être directe). Le point précédent donne la relation
y = pF ⊥ (y) + pF (y)
ce qui montre que tout vecteur H se décompose comme somme d'un vecteur de F et d'un
vecteur deF ⊥ . L'énoncé sur les projections associées à la décomposition est évident à partir
de là.
⊥⊥
5. Il reste à voir que F ⊂ F ce qui donne l'égalité avec le point 1. Mais si y ∈ F ⊥⊥ , y −PF (y) ∈
F ⊥⊥ par 1 et le fait fait que F ⊥⊥ est un sous-espace vectoriel. Mais on vient de voir au 3 que
y − PF (y) = pF ⊥ (y) ∈ F ⊥ . Donc y − PF (y) ∈ F ⊥⊥ ∩ F ⊥ = {0} par le 2. donc y = PF (y) ∈ F ,
ce qui conclut.
93
De plus, on a l'expression duale pour la norme :
||f || = sup |⟨f, v⟩|.
||v||≤1
Remarque . ′
7.3 f 7→ ⟨f, .⟩ est une isométrie antilinéaire identiant
(facultative) Dans le cas complexe,
H et H (et donc identiant linéairement H' au conjugué H ayant la même structure normique et de
groupe mais λ.v = λv si v 7→ v est la bijection/identité de H → H notée . pour le caractère suggestif
′
de la relation à la conjugaison complexe). Dans la cas complexe on a donc H ≃ H et dans le cas
′
réel H ≃ H.
4 Bases Hilbertiennes
Dénition 7.4. Soit H un espace préhilbertien. Une famille (xi )i∈I est dite orthogonale si pour tout
i ̸= j , ⟨xi , xj ⟩ = 0.
Si de plus ||xi || = 1, orthonormale
base hilbertienne
elle est dite .
Une (ou base orthonormale) de H est une famille orthonormale (ei )i∈I telle que
V ect(ei , i ∈ I) est dense dans H.
Exemple . e 7.6 i la suite dont la seule coordonnée non-nulle est la i-ème égale à 1 donne une base
hilbertienne de ℓ2 (I). (par construction de ℓ2 (I)) Les bases hilbertiennes vont permettre d'identier
tout espace de Hilbert à cet exemple.
94
Proposition 7.7. Soit H un espace de Hilbert et F un sous-espace vectoriel de dimension nie
avec (x , . . . , x ) une base de F (non nécessairement orthonormale). Soit B = ⟨x , x ⟩. Alors B est
inversible et pour tout x ∈ E, on a
1 n i,j i j
n
X
pF (x) = (B −1 )j,i ⟨xi , x⟩xj .
i,j=1
Pn
donc i=1 λi xi = 0 donc comme x1 , ..., xn était une base, on obtient λi = 0 pour tout i, ce qui donne
la liberté voulue.
Pour x ∈ H, on a
n
X n
X n
X
−1 −1
⟨xk , x− (B )j,i ⟨xi , x⟩xj ⟩ = ⟨xk , x⟩− (B )j,i ⟨xi , x⟩⟨xk , xj ⟩ = ⟨xk , x⟩− (B −1 )j,i ⟨xi , x⟩Bk,j = 0
i,j=1 i,j=1 i,j=1
Pn −1
donc x− i,j=1 (B )j,i ⟨xi , x⟩xj ∈ F ⊥ donc par caractérisation de la projection orthogonale
n
X
pF (x) = (B −1 )j,i ⟨xi , x⟩xj .
i,j=1
Remarque . 7.5 Voici un cas particulier important du résultat précédent. Soit E un espace de Hilbert
et F un sous-espace vectoriel de dimension nie avec (e1 , . . . , en ) une base orthonormale de F. Alors
pour tout x ∈ E, on a
n
X
pF (x) = ⟨ei , x⟩ei .
i=1
Rappelons que le procédé de Gram-Schmidt permet de calculer une base orthonormale d'un espace
euclidien à partir d'une base donnée :
95
Proposition 7.8 . Soit E un espace euclidien et (e , . . . , e ) une base
(resp. une famille libre) de E. Pour chaque 0 < i ≤ n, notons F le sous-espace vectoriel Vec(e , . . . , e )
(Procédé de Gram-Schmidt) 1 n
engendré par e , . . . , e . Alors, la famille (e , . . . , e ) dénie de la manière suivante est une base or-
i 1 i
′ ′
e1
e′1 =
∥e1 ∥
i−1
X
ei − ⟨e′k , ei ⟩e′k
e′i =
ei − pFi−1 (ei )
∥ei − pFi−1 (ei )∥
= k=1
i−1
X
pour 1 < i ≤ n
∥ei − ⟨e′k , ei ⟩e′k ∥
k=1
Exercice .
3
7.1 Vérier que les vecteurs e1 = (1, 1, 1), e2 = (1, 1, −1) et e3 = (0, 1, 1) forment une base
de IR . Utiliser le procédé de Gram-Schmidt sur cette base pour obtenir une base orthonormale.
Z 2π
1
⟨f, g⟩ = f (t)g(t)dt.
2π 0
C'est la base des décompositions en série de Fourier (on montrera cela plus en détail dans la
section suivante). Le but est de décomposer de façon similaire tout vecteur de H comme somme
d'une série en fonction d'une base.
X
|⟨x, ei ⟩|2 = ||x||2
i∈I
De plus, dans ce cas, pour tout x ∈ H , la série suivante converge (dans H mais pas absolument)
X
x= ei ⟨ei , x⟩.
i∈I
3. Si H est un espace de Hilbert séparable, toute famille orthonormale peut être complétée en une
base hilbertienne dénombrable (e ) de H et J : x 7→ (⟨e , x⟩) établit alors une isométrie
surjective J : H ≃ ℓ (I). En particulier, un espace de Hilbert est séparable si et seulement si
i i∈I i i∈I
2
Démonstration.
P Comme I est dénombrable, on peut supposer et on suppose
P I = IN.
(1) Si λ i xi = 0 , on calcule λj = ⟨xj , λi xi ⟩ = 0 donc xi est bien libre. Soit Vn = V ect(ei , i ∈
[[0, n]]), on a déjà vu la formule pour la projection orthogonale sur Vn :
n
X
pn (x) = ei ⟨ei , x⟩.
i=0
n
X n
X n
X
||pn (x)||2 = ei ⟨ei , x⟩, ej ⟨ej , x⟩ = |⟨ei , x⟩|2 ≤ ||x||2
i=0 j=0 i=0
|||pm (x)||2 − ||pm (xn )||2 | ≤ ||pm (xn − x)||(||xn || + ||x||) ≤ ||(xn − x)||(||xn || + ||x||) ≤ ϵ/2
(avec la dernière inégalité pour n assez grand) d'où en prenant m tel que pm (xn ) = xn (car xn est
dans un certain Vm comme combinaison linéaire nie des ei ), on obtient
m
X
|⟨ej , x⟩|2 − ||x||2 ≤ ϵ
i=0
n
X
|⟨ej , x⟩|2 = ||pn (x)||2 →n→∞ ||x||2
j=0
donc tout élément de H est limite d'éléments de V ect(ei , i ∈ I) d'où la propriété de densité manquante
pour obtenir une base hilbertienne.
De plus un calcul donne la formule pour x :
n
X ∞
X
||x − ei ⟨ei , x⟩||2 = |⟨ei , x⟩|2 → 0.
i=0 i=n+1
(3) Soit O la famille othonormale de départ. Soit K = V ect(O), on cherche une base ortho-
normale de K ⊥ pour compléter O, il est bien séparable comme sous espace de H. Soit (xn )n∈IN
97
une famille dénombrable dense de K ⊥ . Quitte à extraire une sous-suite, on peut supposer que
xn ̸∈ V ect(x0 , ..., xn−1 ) de sorte que (xn )n∈IN est une famille libre.
On peut donc orthonormaliser (x0 , ..., xn ) et obtenir (e0 , ..., en ) tel que V ect(x0 , ...., xn ) = V ect(e0 , ...., en ).
Par la construction, on remarque que l'orthonormalisation pour (x0 , ..., xn+1 ) on commence par les
mêmes vecteurs et on obtient donc une famille orthonormale (fn ) . Comme
n∈IN
V ect(xn , n ∈ IN) = ∪∞ ∞
n=0 V ect(x0 , ...., xn ) = ∪n=0 V ect(f0 , ...., fn ) = V ect(fn , n ∈ IN),
ces deux ensembles sont denses et donc (fn )n∈IN est une base de K ⊥ . Maintenant, O et (fn )n∈IN
forment une famille orthonormale de H et tout O est une base de K par dénition de K , donc la
décomposition orthogonale x = PK (x) + PK ⊥ (x) permet d'approcher PK (x) par un élément yn ∈
V ect(O), PK ⊥ (x) par un élément zn ∈ V ect(fn , n ∈ IN) et yn + zn ∈ V ect(O, fn , n ∈ IN) tend vers x,
d'où la densité voulue pour que {en , n ∈ IN} = O ∪ {fn , n ∈ IN} forme une base de H .
Une fois l'existence d'une base, l'isométrie est évidente par le (2), et si on a une suite (λi )i∈I dans
2
P
ℓ (I), on voit que λi ei converge par complétude comme ci-dessus et on obtient ainsi la surjectivité.
On vient de voir (en prolongeant la famille vide) qu'un espace de Hilbert séparable a une base
dénombrable. Réciproquement, un espace de Hilbert à base dénombrable est isométrique à ℓ2 (IN)
pour lequel Vect (en , n
Q
l
∈ IN} donne une famille dénombrable dense.
Exemple . 7.9 Montrons que en (x) = exp(inx), n ∈ ZZ forme une base hilbertienne de L2 ([0, 2π], C
l) :
Z 2π
1
⟨f, g⟩ = f (t)g(t)dt.
2π 0
Enn, il reste à voir que V ect(en ) est dense. Or, on a V ect(en ) = {P (eix , e−ix ), P ∈ C l [X, Y ]} =
2 2 2 0
{P (cos(x), sin(x)), P ∈ C
l [X, Y ]}. Soit D = {(x, y) ∈ IR , x + y = 1}, soit f ∈ C2π (IR, C l ) On dénit
g:D→C l par g(cos(x), sin(x)) = f (x). Il est facile de voir que g est continue sur D (utiliser tan, cot
selon le point comme carte coordonnée) donc par le théorème d'approximation de Weierstrass C.7,
il existe un polynôme P tel que ||P − g||∞ ≤ ϵ donc, si Q = P (cos(.), sin(.)) ∈ V ect(en ), on a
||Q − f ||2 ≤ ||Q − f ||∞ ≤ ||P − g||∞ ≤ ϵ. D'où la densité voulue.
C'est la base des décompositions en série de Fourier.
98
Exercice . 7.2 Soit H = L2 (IR, B(IR), γ) l'espace de Hilbert réel des fonctions de carrés intégrables
2
B par γ(B) = B √12π e−x /2 dx. H muni
R
pour la mesure gaussienne standard dénie pour un borélien
de la norme usuelle :
sZ
e−x2 /2
||f ||2 = |f (x)|2 √ dx.
IR 2π
Soit n
x2 /2
ne d 2 /2
Hn (x) = (−1) √ (e−x )
n! dx
(et donc H0 (x) = 1). On appelle les Hn les polynômes d'Hermite .
n−1
xn X
Hn (x) = √ + ak x k .
n! k=0
Théorème 7.10. Soit γ la mesure gaussienne standard sur IR. Alors la famille des polynômes
d'Hermite (H ) est une base orthonormale de L (IR, B(IR), γ). En particulier, les polynômes sont
2
N N
X |(it)n |2 X (t2 )n
||SN ||22 = exp(−t ) 2
= exp(−t ) 2
≤ exp(t2 − t2 ) = 1
n=0
n! n=0
n!
(t2 )n
p ≥ q ≥ N , ||Sp+1 − Sq ||22 ≤ exp(−t2 ) ∞
P
Donc pour n=N n! →N →∞ 0. Donc Sn est de Cauchy
2
et donc converge dans L . Quitte à extraire on sait qu'elle converge presque partout, donc sa limite
2
ponctuelle sera aussi sa limite dans L . Concluons que Ft , dénie par Ft (x) = exp(itx), est la limite.
Il sut donc de voir que pour tout x ∈ IR :
∞
X (−it)n
2
Ft (x) = exp(−t /2) √ Hn (x).
n=0 n!
∞ n
X (−it)n d 2
2 2
Ft (x) exp(t /2 − x /2) = exp(−(it − x) /2) = 2
(e−x /2 )
n=0
n! dx
99
2
ce qui est la somme de la série de Taylor en x évaluée en a = it de f (x) = exp(−x /2) (pour f somme
P∞ an (n)
l f (x + a) =
de série entière sur C n=0 n! f (x). Ceci est bien vérié car la fonction du milieu est
analytique par composée de fonctions analytiques sur C l (un polynôme et exp sont sommes de séries
entières sur C
l donc aussi leur composée).
Conclusion : on a Ft ∈ V ect(Hn , n ∈ IN).
On montre maintenant que toute fonction f ∈ L2 (IR, B(IR), γ), orthogonale à K := V ect(Hn , n ∈
IN) est nulle. On peut supposer f réelle en prenant partie réelle et imaginaire. Si f orthogonale à
tout Hn on a ⟨f, Ft ⟩ = 0 et donc
Z
u(t) = f (x)exp(itx − x2 /2) = 0.
Or si g(x) = f (x)exp(−x2 /2) g ∈ L1 (IR, λ) est équivalent à f ∈ L1 (IR, B(IR), γ) ce qui est le cas
2 1
car γ est une mesure de probabilité et donc L (IR, B(IR), γ) ⊂ L (IR, B(IR), γ). Donc on a ĝ(t) = 0
2
et par le théorème d'inversion de Fourier, g(x) = 0 presque partout, soit f = 0 dans L (IR, B(IR), γ).
⊥ ⊥⊥
Bilan pour K = V ect(Hn , n ∈ IN) K = {0} donc K = K = {0}⊥ = L2 (IR, B(IR), γ), d'où la
densité voulue.
On a utilisé le théorème suivant (peut-être vu en cours de probabilité, cf. annexe E section 4 pour
la variante sur les mesures de probabilité, cf. aussi le livre de Rudin d'analyse réelle et complexe Thm
9.11 et 9.12 pour n = 1)
Dénition 7.5. Soit f ∈ L1 (IRn , B(IRn ), λ) la transformée de Fourier de f est la fonction de t ∈ IRn :
Z
fˆ(t) = n
ei⟨x,t⟩ f (x)λ(dx).
IR
sont égales :
1 2
fˆ (t) = fˆ (t), ∀t ∈ IR .
1 2
n
100
Dénition 7.6. Une suite (Xn )n∈IN est une martingale dans L 2
(pour la ltration (Tn )n≥0 si pour
tout m ≥ n PHn (Xm ) = Xn .
Cette condition dit que la moyenne de la future variable Xm , conditionnellement au présent Hn , est
Xn (si Xn est la valeur d'un gain au temps n, en moyenne on n'a rien gagné à attendre le temps
égale à
m > n). Une somme de v.a. i.i.d. dans L2 d'espérance nulle est une telle martingale. Par exemple,
la somme des n premiers termes d'une suite de variables gaussiennes centrées indépendantes donne
2
une martingale dans L . On va montrer un théorème de convergence pour les martingales bornées
2
dans L .
Théorème 7.12. Soit (T ) .Soit (X ) IN est une martingale dans H = L (Ω, T , P ) qui est une 2
suite bornée, c'est-à-dire, qu'il existe M > 0 telle que sup ||X || ≤ M . Alors X converge dans
n n≥0 n n∈
p
Ce théorème se généralise à un théorème de convergence des martingales bornées dans L , 1 <
1
p < ∞. Il y a aussi une version pour les martingales L mais il faut une hypothèse technique
plus compliquée (dite d'uniforme intégrabilité). (On dit que Xn est une martingale fermée quand
Xn = PHn (X) comme ci-dessus).
n
X
||Xn+1 ||22 = ||Xn+1 − Xn ||22 + ||Xn ||22 = ||X0 ||22 + ||Xk+1 − Xk ||22 .
k=0
P∞
On déduit donc de la bornitude en prenant la limite ||X0 ||22 + k=0 ||Xk+1 − Xk ||22 ≤ M 2 et donc la
série est convergente. On déduit aussi que pour p≥q≥N
p ∞
X X
||Xp+1 − Xq ||22 = ||Xk+1 − Xk ||22 ≤ ||Xk+1 − Xk ||22 →N →∞ 0.
k=q k=N
Donc (Xn ) est de Cauchy dans un espace de Hilbert donc converge vers X . Comme PHn est 1-lipschitz
donc continue, on déduit en passant à la limite dans la relation Xn = PHn (Xm ) →m→∞ PHn (X) = Xn
101
Annexe A
1 d(x, K2 ) − d(x, K1 )
f (x) = , d(x, Ki ) := inf{d(x, y), y ∈ Ki }.
3 d(x, K2 ) + d(x, K1 )
(On comprend la valeur comme 0 si K1 et K2 vides et sinon, −1/3 si K1 vide, 1/3 si K2 vide).
Vérier que f ∈E
3. Montrer que ||f ||∞ ≤ 1/3 et ||p(f ) − g||∞ ≤ α = 2/3..
4. Construire une suite fn par récurrence à partir du résultat précédent telle que fn = F0 +...+Fn
et
n
X 1 2n
||Fk ||∞ ≤ (1 + ... + n )
k=0
3 3
et
2n+1
||p(fn ) − g||∞ ≤ .
3n+1
5. Montrer que fn converge. En déduire, qu'il existe F ∈ E, ||F ||∞ ≤ 1 telle que p(F ) = g.
Extension de Tietze-Urysohn (Correction)
Soit F un fermé de X espace métrique. Soit E = Cb0 (X, IR) et p : E → Cb0 (F, IR) l'application de
restriction. On va montrer que p est surjective (et un peu mieux).
1 d(x, K2 ) − d(x, K1 )
f (x) = , d(x, Ki ) := inf{d(x, y), y ∈ Ki }.
3 d(x, K2 ) + d(x, K1 )
102
1. Soit g ∈ C 0 (K) avec ||g||∞ ≤ 1. Soient K1 := g −1 ([1/3, 1]) et K2 := g −1 ([−1, −1/3]). Soit :
1 d(x, K2 ) − d(x, K1 )
f (x) = , d(x, Ki ) := inf{d(x, y), y ∈ Ki }.
3 d(x, K2 ) + d(x, K1 )
Vérions que f ∈ E, ||f ||∞ ≤ 1/3 et ||p(f ) − g||∞ ≤ α = 2/3. (on dit que p est presque
surjective)
f est continue car d(., Ki ) est continue et le dénominateur est non nul car K1 ∩ K2 = ∅ et
d(., Ki ) > 0 sur Kic .
2. Or par l'inégalité triangulaire :
1 d(x, K2 ) + d(x, K1 ) 1
|f (x)| ≤ =
3 d(x, K2 ) + d(x, K1 ) 3
donc f est bornée et ||f ||∞ ≤ 1/3.
1 1
|p(f ) − g| = 1K1 | − g| + 1K2 | − − g| + (1K − 1K1 − 1K2 )|f − g|
3 3
1 1
≤ 1K1 ||1K1 ( − g)||∞ + 1K2 ||1K1 (− − g)||∞ + (1K − 1K1 − 1K2 )(||f ||∞ + ||g(1K − 1K1 − 1K2 )||∞ )
3 3
et tous les termes sont inférieurs à 2/3 par dénition.
3. On construit construire une suite fn par récurrence à partir du résultat précédent telle que
fn = F0 + ... + Fn
n
X 1 2n
||Fk ||∞ ≤ (1 + ... + n )
k=0
3 3
et
2n+1
||p(fn ) − g||∞ ≤ .
3n+1
On prend f0 = F0 = f donné par 1 à partir de g . On prend Fn /||p(fn−1 ) − g||∞ donné par 1
à partir de −[p(fn−1 ) − g]/||p(fn−1 ) − g||∞ (si le dénominateur est 0 on s'arrête et on prend
la suite constante).
1 1 2n
||Fn ||∞ ≤ ||p(fn−1 ) − g||∞ ≤
3 3 3n
et
2 2n+1
||p(Fn ) + p(fn−1 ) − g||∞ ≤ ||p(fn−1 ) − g||∞ ≤ n+1
3 3
2n+1
La deuxième inégalité donne ||p(fn ) − g||∞ ≤ n+1 . La première inégalité suit par l'hypothèse
3
de récurrence.
P
4. Déduisons qu'il existe F ∈ E, ||F ||∞ ≤ 1 telle que p(F ) = g. Fn P
est donc absolument
convergente dans E, donc par complétude convergente, donc soit F = ∞ n=0 Fn = lim fn . En
passant à la limite on obtient (par la somme d'une série géométrique)
∞ ∞
X 1 X 2n+1 1 1
||F ||∞ ≤ ||Fn ||∞ ≤ ≤ =1
n=0
3 n=0 3n+1 3 1 − 2/3
103
2 Complément sur l'Espace dual (niveau début de M1)
Dénition A.1. L'espace E ′ := L(E, IK) des formes linéaires continues sur un e.v.n. E est munie
de la norme d'opérateur
||f ||E ′ := sup |f (x)|.
x∈E,||x||≤1
On a vu dans la section précédente que c'est toujours un espace de Banach. Il sera très utile
dans ce cours pour étudier E lui-même.
Le résultat suivant, conséquence de Hahn-Banach permet de décrire réciproquement la norme de
′
E en terme de celle de E (cela ressemble à la dénition de ||f ||E ′ mais c'est un théorème dicile !
que l'on exploitera pour relier E au dual du dual dans la section suivante) :
Exemple . c (I)
A.1 0 est l'ensemble des suites (xi )i∈I qui tendent vers 0 dans le sens où si ϵ > 0, il
existe une partie F nie telle que |xi | ≤ ϵ pour tout i ̸∈ F. On munit c0 (I) de la norme sup :
ℓ∞ (I) est l'ensemble des suites bornée (xi )i∈I avec la même norme ||x||∞ .
Exemple . ℓ (I)
A.2
1
est l'ensemble des suites (xi )i∈I sommables, tel qu'il existe une constante C , tel
|xi | ≤ C . On munit ℓ1 (I) de la norme :
P
que pour toute partie F nie telle que i∈F
X X
||x||1 = sup |xi | =: |xi | < ∞.
F
i∈F i∈I
On étudiera la dualité des espaces Lp dans un chapitre ultérieur. Le résultat suivant donne un
exemple de calcul de dual :
X
T ((ui ))[(vi )] = ui vi .
i∈I
104
Bien sûr, on a l'inégalité montrant que T est bien déni et contractant :
X X
|T ((ui ))[(vi )]| ≤ |ui | |vi | ≤ ||c∥∞ |ui |.
i∈I i∈I
1
Montrons que T
est isométrique. Comme les suites à support ni sont denses dans ℓ (I) il sut
vi
de montrer l'égalité dans ce cas, et cela vient en posant (vi ) = 1{vi ̸=0}
|vi |
∈ c0 (I) si (ui ) à support ni
de T ((ui ))(vi ) = ||(ui )||ℓ1 . Donc comme ||(vi )||c0 ≤ 1 on a l'inégalité manquante :
||(ui 1i∈F )||ℓ1 ≤ ||T ((ui 1i∈F ))||(c0 )′ = ||T ((ui )) ◦ vF ||(c0 )′ = ||f ◦ vF ||(c0 )′ ≤ ||f ||(c0 )′
car vF ((xi )) = (1i∈F xi ) est une contraction sur c0 pour F ni (et par le calcul à support ni qui suit
qui implique f ◦ vF = T ((ui )) ◦ vF ). Donc pour tout F ni :
X
|ui | ≤ ||f ||(c0 )′
i∈F
Un autre résultat de base permet d'associer à une application continue u:E→F une application
t ′ ′
(dite transposée ou adjoint) entre les duaux u : F → E .
Démonstration. ′
Par composition, si f ∈ F ′, u linéaire continue,
t
f ◦ u est linéaire continue donc
appartient à E. La linéarité en f est évidente. de plus ||u (f )(x)|| ≤ ||f ||F ′ |||u|||||x||E donc
||u(x)||F = sup |(ut (f )(x))| ≤ sup ||(ut (f )||E ′ ||x||E ≤ |||ut |||||x||E .
||f ||F ′ ≤1 ||f ||F ′ ≤1
Ceci donne par dénition de la norme subordonnée, l'autre inégalité : |||u||| ≤ |||ut |||.
105
3 Bidual, Complété (niveau début de M1)
Le dual du dual E ′′ = (E ′ )′ est appelé bidual de E .
Dénition A.2. J : E → E ′′ J(x)(f ) = f (x) f ∈ E′
injection canonique
L'application qui envoie pour est appelée
de E dans E ′′ .
Proposition A.4. L'injection canonique J : E → E est une isométrie (c'est pour cela que c'est
′′
une injection).
Démonstration. En appliquant la dénition de la norme du dual puis la conséquence de Hahn-Banach
de la section précédente (proposition A.1), on obtient :
On donne un exemple :
Proposition A.5.
(c0 (I))′′ ≃ (ℓ1 (I))′ ≃ ℓ∞ (I).
Démonstration. On dénit T : ℓ∞ (I) → (ℓ1 (I))′ par :
X
T ((ui ))[(vi )] = ui vi .
i∈I
Montrons que T est surjectif. Soit f ∈ (ℓ1 (I))′ et ei la suite valant 1 en i et 0 ailleurs. Soit
ui = f (ei ), alors |ui | ≤ ||f ||ℓ1 donc (ui ) ∈ ℓ∞ (I), montrons que f = T ((ui )).
En eet, si v est à support ni, f (v) = T ((ui ))(v) par linéarité mais comme les deux côtés sont
1
continus en v et que (par dénition) les suites à support ni sont denses dans ℓ (I), on obtient
f = T ((ui )).
Montrons que T est isométrique. Mais ||T (ui )|| ≥ |T (ui )(ei )| = |ui | donc ||T (ui )|| ≥ ||(ui )||ℓ∞ (I)
et on obtient donc l'égalité.
′′
Dénition A.3. L'adhérence b := J(E)E E
E dans E ′′ est appelée complété de E .
Comme c'est un espace fermé d'un espace complet, c'est un espace de Banach muni d'une injection
i:E→E
b (qui est id si E est déjà n espace de Banach). Il est caractérisé par la propriété universelle
suivante. Contrairement à la compacité qui est dure à trouver en dimension innie, la complétude
est simple grâce à cette construction, car il sut de passer au complété (mais, dans des espaces de
fonctions, il faut travailler pour décrire plus explicitement ce complété, comme espace de fonctions
concrètes).
106
Démonstration. (ut )t : E ′′ → F ′′ et on regarde sa restriction u
pour l'existence on considère bàE b.
b coincide avec u donc est à valeur dans F . Par densité de E , l existe une suite un → u ∈ E
Sur E , u b
et donc ub(E) ⊂ F . Or comme F est complet il est fermé dans son bidual donc F = F . Cela donne
b b b
l'existence. L'unicité vient de la densité de E dans Eb . Par la construction on a |||û||| ≤ |||u|||. L'autre
inégalité vient par densité.
On rappelle le résultat suivant (cf. e.g. Zuily-Quéelec Th II.1 p135 ou Gourdon d'Analyse p 32) :
Proposition A.7. Un espace métrique X est compact si et seulement si il est précompact et complet.
Démonstration. L'implication, compact implique précompact vient de la dénition. L'implication
compact implique complet vient de Bolzano-Weierstrass (vu qu'une suite de Cauchy ayant une sous-
suite convergente converge).
Réciproquement, on utilise aussi Bolzano-Weierstrass. On va construire une suite extraite de
Cauchy par extraction diagonale. Soit (xn ) suite de X .X est recouvert par un nombre ni de boules
B(a, 1) donc par principe des tiroirs, il existe une sous-suite (xϕ0 (n) ) de (xn ) contenu dans une de ces
p
boules B(a0 , 1). Par récurrence, on obtient une suite extraite (xϕ0 ◦...◦ϕp (n) ) contenu dans B(ap , 1/2 )
p p−1
en ayant choisi un recouvrement ni B(a, 1/2 ) de B(ap−1 , 1/2 ) et un terme de ce recouvrement
contenant une sous-suite de la suite-extraite précédente (xϕ0 ◦...◦ϕp−1 (n) ). On considère l'extraction
diagonale yn = xϕ0 ◦...◦ϕn (n) . Vu que ϕi (n) ≥ n car les ϕi sont strictement croissantes, ψ(n) = ϕ0 ◦
... ◦ ϕn (n) ≥ ϕ0 ◦ ... ◦ ϕn−1 (n) > ϕ0 ◦ ... ◦ ϕn−1 (n − 1) = ψ(n − 1) donc yn = xψ(n) est bien une suite
n
extraite telle que à partir du rang n, (yk )k≥n extraite de (xϕ0 ◦...◦ϕn (k) ) est dans la boule B(an , 1/2 ).
Donc yk est de Cauchy donc converge par complétude.
N N
X X k1 kn
BN (f )(x1 , ..., xn ) = ··· CNk1 ...CNkn f ( , ..., )xk11 (1 − x1 )N −k1 ...xknn (1 − xn )N −kn
k1 =0 kn =0
N N
107
Démonstration. On interprète de façon probabiliste BN (f ). Soit Ω = {0, 1}N n avec la mesure de
probabilité
P (ω1 = i1 , ..., ωN n = in ) = xk11 (1 − x1 )N −k1 ...xknn (1 − xn )N −kn
ω +...+ω
avec ki le nombre de 1 parmi iN (i−1)+1 , ..., iN i . On note S1 (ω) = ω1 +...+ω
N
N
, ..., Sn (ω) = N (n−1)+1N Nn
,S =
R(S1 , ..., Sn ) qui sont des variables de loi binomiales indépendantes du point de vue probabiliste. Alors
dP f (S1 , ..., Sn ) = BN (f )(x1 , ..., xn ), donc si ω(h) = sup{|f (x) − f (y)| : |x − y| ≤ h} est le module
d'uniforme continuité de f , on a :
|f (x1 , ..., xn ) − BN (f )(x1 , ..., xn )| ≤ ||f (x1 , ..., xn ) − f (S)||1 ≤ ω(δ) + 2||f ||∞ P (|(x1 , ..., xn ) − S| ≥ δ)
n n
X X E(|xi − Si |2 )
P (|(x1 , ..., xn ) − S| ≥ δ) ≤ P (|xi − Si | ≥ δ) ≤
i=1 i=1
δ2
xi (1−xi ) 1
Or un calcul simple donne E(|xi − Si |2 ) = V ar(Si ) = N
≤ 4N
donc
2n||f ||∞
lim sup sup |f (x1 , ..., xn ) − BN (f )(x1 , ..., xn )| ≤ lim sup ω(δ) + = ω(δ) →δ→0 0.
N →∞ (x1 ,...,xn )∈[0,1]n N →∞ 4N δ 2
nômes (à coecients complexes) sont denses dans C (K, Cl ). En conséquence, C (K, Cl ) est séparable.
(Théorème d'approximation de Weierstrass)
0 0
Démonstration. K
Comme K ⊂ [−N, N ]
est fermé borné,
n
f
et par le théorème de Tietze D.3,
continue sur K se prolonge en une fonction continue sur [−N, N ]n , il sut donc du cas K = [−N, N ]n
que l'on obtient par translation et dilatation (qui conservent les polynômes) du résultat précédent.
l [i]
Comme Q := Q
l + iQ
l est dense dans C, l [i]
l on voit facilement que les polynômes à coecients dans Q
sont aussi denses, et forment un ensemble dénombrable, comme union dénombrable des polynomes
de degré au plus m
en chaque variable (c'est plus simple à décrire qu'en terme de degré total) qui
Pm i1 in mn 2mn
s'écrivent sous la forme l [i]
i1 ,...,in =0 λi x1 ...xn et qui s'identient donc au produit Q ≃Q
l , qui
est dénombrable comme produit ni d'ensembles dénombrables.
Remarque . A.1 Plus généralement, le théorème de Stone Weierstrass indique que toute sous-algèbre A
(stable par conjugaison complexe) de C 0 (K, C
l ) avec K compact qui contient les fonctions constantes
et sépare les points (au sens pour x ̸= y il existe P ∈A avec P (x) ̸= P (y)) est dense pour la norme
0
uniforme :A = C (K, C l ).
Remarque . A.2 Soit(Y, d) un espace métrique borné, dy ∈ (Cb0 (Y, IR)), dy (x) = d(y, x) la distance à
y . ||dy − dz || = supx∈Y |d(y, x) − d(z, x)| = d(y, z) (car ≤ par l'inégalité triangulaire inverse et ≥ en
0
prenant x = y ou x = z ) Donc d : Y → Cb (Y, IR) est une isométrie.
108
Dénition A.5. X, Y des espaces métriques, une partie F ⊂ C 0 (X, Y ) est
Soient équicontinue
si
pour tout ϵ > 0, il existe δ = δ(ϵ) > 0, tel que ∀x, y ∈ X, ∀f ∈ F , si d(x, y) ≤ δ alors d(f (x), f (y)) ≤ ϵ.
Par exemple une famille d'application K -lipschitziennes (comme une famille de la boule unité
fermé de rayon K des applications linéaires continues entre espaces de Banach) forme une famille
équicontinue.
Théorème A.11 . Soient X, Y des espaces métriques compacts, si une partie F est équi-
continue alors F est compacte (pour la topologie de la convergence uniforme donnée par la distance
(d'Ascoli)
Démonstration. Y
Comme compact il est complet borné doncd : Y → C (Y, )
0
0
b IR est une isométrie et
d(Y ) est complet donc fermé. Elle induit une isométrie de C (X, Y ) → C 0 (X, Cb0 (Y, IR)) qui est un
espace de Banach. Les équations f (x) ∈ d(Y ), x ∈ X montrent que l'image de l'isométrie est fermé
−1 0
(comme intersection de fermés ∩x∈X evx (d(Y )), evx (f ) = f (x)) donc complet. Donc C (X, Y ) est
aussi complet (on aurait aussi pu reprendre la preuve du cas Y Banach) et F aussi.
Il reste à voir que F est précompact. Or en recouvrant F par des boules de rayon ϵ/2, F est
recouvert par les boules de même centre et rayon ϵ, donc il sut de voir F précompact. Soit ϵ > 0,
on xe δ(ϵ) > 0 donné par l'équicontinuité et R les centres d'un recouvrement de X par des boules
de rayons δ(ϵ) donné par sa précompacité.
Remarquons que si d(f (r), g(r)) ≤ ϵ pour tout r ∈ R, en prenant r avec d(x, r) ≤ δ(ϵ), on a par
l'équicontinuité et l'inégalité triangulaire :
d(f (x), g(x)) ≤ d(f (x), f (r)) + d(f (r), g(r)) + d(g(r), g(x)) ≤ 3ϵ ⇒ d(f, g) ≤ 3ϵ.
Soit enn S
les centres des boules de rayon ϵ/2 recouvrant Y . Nous allons indicer les boules d'un 4ϵ
R R
recouvrement par les applications S de R vers S en nombre ni. Pour ϕ ∈ S , soit
Si f, g ∈ Fϕ alors l'inégalité triangulaire donne, d(g(r), f (r)) ≤ ϵ pour tout r donc d(f, g) ≤ 3ϵ et si
Fϕ est non-vide il est inclus dans B(bϕ , 4ϵ).
Enn, il sut donc de voir que F ⊂ ∪ϕ∈S R Fϕ . Or chaque valeur possible de f (r) est à distance
inférieure à ϵ/2 d'un s = ϕ(r) ∈ S pour un certain ϕ, ce qui conclut.
109
Annexe B
convexes
110
Exemple . B.1 Soit A = {(x, y) ∈ IR2 : x ≥ y ≥ 0, }. Calculons NA (0) le cône normal en 0 = (0, 0).
D'abord on essaye de borner supérieurement l'ensemble. En prenant [(0, 0), (1, 1)] ⊂ A, on a
NA (0) ⊂ N[(0,0),(1,1)] (0) = (IR(1, 1))⊥ + IR+ (−1, −1) = {λ(1, −1) + µ(−1, −1), λ ∈ IR, µ ≥ 0}
De même
NA (0) ⊂ N[(0,0),(1,0)] (0) = (IR(1, 0))⊥ + IR+ (−1, −1) = {λ′ (0, 1) + µ′ (−1, 0), λ′ ∈ IR, µ′ ≥ 0}
Donc NA (0)
est inclus dans l'intersection, résolvons le système (−µ′ , λ′ ) = (λ − µ, −λ − µ) avec
′ ′
les conditions ci-dessus ,λ, λ ∈ IR, µ, µ ≥ 0 Il faut donc −λ − µ = −λ + µ − 2µ = µ′ − 2µ donc
Montrons qu'il y a égalité en montrant que (−1, 1) ∈ NA (0) et (0, −1) ∈ NA (0) (car on a alors l'autre
inclusion par le 3 de la précédente proposition).
La formule du cas convexe donneTA (0) = A donc soit (x, y) ∈ A, on calcule ⟨(x, y), (−1, 1)⟩ =
y − x ≤ 0 d'après l'équation de A donc (−1, 1) ∈ NA (0).
Enn ⟨(x, y), (0, −1)⟩ = −y ≤ 0 donc (0, −1) ∈ NA (0) comme voulu.
On a donc
NA (0) = IR+ (−1, 1) + IR+ (0, −2).
On est maintenant prêt pour la :
1. les l premières contraintes sont actives, c'est à dire : g1 (x) = ... = gl (x) = 0
2. les autres contraintes ne sont pas actives, c'est à dire gl+1 (x) < 0, ...gn (x) < 0
Si l = 0, on a
x ∈ Int(C) = {x ∈ IRm : ∀i ∈ {1, ..., n}, gi (x) < 0}
donc NC (x) = {0} par la proposition B.1.2. Sinon, le but est de voir :
( l )
X
NC (x) = λi ∇gi (x), λi ≥ 0 .
i=1
Etape 1 : inclusion ⊃.
Par la proposition B.1.3. il sut de voir que ∇gi (x) ∈ NC (x) pour 1 ≤ i ≤ l, soit autrement dit
par dénition de NC (x), il faut voir :
⟨∇gi (x), u − x⟩ ≤ 0, ∀u ∈ C
car u ∈ C.
Etape 2 : inclusion ⊂.
111
Soit f ∈ NC (x).
On remarque d'abord que si on prend h0 = x0 − x on a dgi (x)(h0 ) ≤ gi (x0 ) − gi (x) = gi (x0 ) < 0
pour tout i = 1, ..., l.
Soit donc maintenant h tel que dgi (x)(h) < 0, i = 1, ..., l (il en existe par la remarque), alors
gi (x + th) − gi (x) = tdgi (x)(h) + o(t) donc gi (x + th) < 0 pour t > 0 petit, et i = 1, ...l De plus pour t
assez petit comme gl+1 (x) < 0, ...gn (x) < 0, on déduit par continuité gl+1 (x+th) < 0, ...gn (x+th) < 0
d'où x + th ∈ A pour tout t assez petit.
Par dénition de NC (x), on a donc ⟨f, x+th−x⟩ ≤ 0 donc en particulier ⟨−f, h⟩ ≥ 0 et on ne peut
pas avoir −⟨f, h⟩ < 0. Donc −f, dg1 (x), ..., dgl (x) vérient la première condition de la Proposition
n
B.15 (avec E = IR ) donc aussi la seconde et sont donc positivement linéairement dépendants. On a
Pl
donc des λi positifs non tous nuls tel que −λ0 f + λ ∇g (x) = 0.
Pl i=1 i i
Montrons enn que λ0 ̸= 0. Si on avait i=1 λi ∇gi (x) = 0, il n'y aurait pas de h tel que
dgi (x)(h) < 0 pour tout i = 1, ..., l ce qui contredit dgi (x)(h0 ) < 0.
On conclut à l'égalité voulu :
l
( l )
X λi X
f= ∇gi (x) ∈ λi ∇gi (x), λi ≥ 0
λ
i=1 0 i=1
n
X m
X
λy1 + (1 − λ)y2 = λti xi + (1 − λ)sj zj .
i=1 j=1
Pn Pm ′
Comme i=1 λti + j=1 (1 − λ)sj = λ + (1 − λ) on déduit λy1 + (1 − λ)y2 ∈ Convn+m (A). Ceci
′
montre que Conv (A) est un convexe qui contient A.
Pn
Il est facile de voir que tout ensemble convexe est stable par combinaison convexe i=1 ti xi avec
ti = 1, ti ≥ 0 par récurrence surPn et ainsi Con′n (A) ⊂ Conv(A)
P
. Si tn = 1, les autres sont nuls et
n 1
Pn
rien n'est à montrer. En écrivant i=1 ti xi = (1 − tn )( 1−tn i=1 ti xi ) + tn xn on a par l'hypothèse de
1
Pn 1
Pn
récurrence
1−tn i=1 ti xi ∈ Conv(A) car yn := 1−tn Ptni = (1 − tn )/(1 − tn ) = 1 (et les coecients
i=1
sont positifs). Donc on a aussi la combinaison convexe i=1 ti xi = (1 − tn )yn + tn xn ∈ Conv(A).
112
n
Dans IR il ne sut que du barycentre de n+1 points.
n+1
X X
Conv(A) = ti xi , xi ∈ A, avec ti = 1, ti ≥ 0 .
i=1
Les deux ensembles suivant seront importants pour formuler des conditions pour des problèmes
de minimisation sous contrainte.
Dénition B.2. Le cône tangent de l'ensemble A⊂E e.v.n. au point a∈A est
ai − a
TA (a) := {b ∈ E : ∃ai → a, ai ∈ A, ti > 0, ti → 0 : b = lim }
ti
Le cône normal est son polaire, c'est à dire le cône convexe fermé :
Proposition B.4. Si S est convexe et x ∈ S, alors T (S) est convexe et S ⊂ x + T (S). De plus,
on a
x x
u−x
Tx (S) = { , u ∈ S, s > 0}, Nx (S) = {f ∈ E ′ : ∀u ∈ S, f (u − x) ≤ 0}
s
Démonstration. ∗
IR+ (S − x) est convexe comme S − x donc en prenant l'adhérence, aussi l'ensemble
W = IR∗+ (S − x) que l'on veut montrer être TS (x). Si on a une suite (xn − x)/tn → u ∈ TS (x)
comme tous les éléments sont dan W , on obtient par fermeture aussi la limite, donc TS (x) ⊂ W.
t
Réciproquement, pour t > 0, xn :=
n
(u − x) + x = nt u + (1 − nt )x ∈ S pour n assez grand par
convexité et (xn − x)/tn = t(u − x) si tn = 1/n → 0 donc t(u − x) ∈ TS (x) comme voulu. Les autres
relations sont alors évidentes, car S − x ⊂ TS (x) (car s = 1) et par la dénition de NS (x) comme
polaire.
113
2. Si f de classe C 1. Soit a f , un sous espace vectoriel H ⊂ IRn est un plan
un point critique de
d'inexion si pour toute droite ∆ passant par a inclus dans a + H , f|∆ n'a pas d'extrema local
en a.
Remarque . B.1 La décomposition F ⊕G d'un point selle n'est pas forcément unique et on ne demande
rien en dehors (a + G) ∪ (F + a), en particulier, il peut y avoir des plans d'inexion en un point selle
(ex f (x, y) = x2 − y 2 + (x − y)3 , (0, 0) est un point selle local dans la décomposition (IR, 0) ⊕ (0, IR)
2 3 2 3
car x + x a un minimum local en 0 et −y − y un maximum local, de même (0, 0) est un point
selle dans la décomposition IR(1, 1/2) ⊕ IR(1/2, 1) mais IR(1, −1) est une droite d'inexion)
Démonstration.
n
Pour (1) on remarque qu'il sut de montrer df (a) = 0 ce qui ne dépend pas de la
base de IR on peut donc supposer a point selle pour la décomposition F = IRk ×{0}, G = {0}× IRn−k .
Comme f restreint à a+F k premières dérivées partielles s'annulent, les n-k
à un minimum local, les
dernières s'annulent à cause du maximum sur a + G, d'où df (a) = 0.
2
La preuve de (2) nécessite quelques bases d'algèbre linéaire. Pour (2), comme D f (a) est non
dégénérée, les valeurs propres de H(f )(a) (les racines du polynôme X 7→ det(H(f )(a) − Xid)) sont
2
non nulles. Comme la matrice D f (a) n'est ni positive ni négative, il y a à la fois des valeurs propres
λ positives et négatives. Soit F l'espace vectoriel engendré par les vecteurs propres u (les u ∈ IRn tels
que H(f )(a)u = λu qui existent car si det(H(f )(a) − λid) = 0, H(f )(a) − λid n'est pas injective donc
2
a un noyau) des valeurs propres λ strictement positives, et de même G avec les négatives. D f (a)
restreint à F est positive donc f |a+F admet un minimum local et de même pour G.
Pour (3), si dim(H) > n/2 et supposons par l'absurde a point selle, on a dim(F ) + dim(G) = n,
on a soit dim(F ) ≥ n/2, soit dim(G) ≥ n/2, disons qu'on se trouve dans le premier cas, alors
n ≥ dim(H + F ) = dim(F ) + dim(H) − dim(F ∩ H) implique dim(F ∩ H) ≥ dim(F ) + dim(H) − n >
n/2 + n/2 − n = 0 donc F ∩ H ̸= {0} une contradiction car la restriction de f à toute droite dans
a + F ∩ H devrait avoir un minimum local en a et un point d'inexion à la fois. Si D2 f (a)(H, H) ̸= 0,
on a vu que cela sut à ce que f ait un extremum local sur la droite a+ IRH, vu si ϕ(λ) = f (a+λH),
ϕ′′ (0) = D2 f (a)(H, H).
Théorème B.6. Soient A ⊂ IRn−k , B ⊂ IRk des compacts convexes et K : C = A×B → IR continue.
Si pour tout (a, b) ∈ C, a ∈ IR , b ∈ IR , x 7→ K(x, b) est convexe et y 7→ K(a, y) est concave, alors
n−k k
il existe un point de C qui soit un point selle (x , y ) selon la décomposition IR × {0} ⊕ {0} × IRn−k k
autrement dit :
0 0
114
Remarque . B.2 On a des M in et M ax au lieu d'inf et sup car des fonctions continues sur des compacts
atteignent leurs bornes (cf. la preuve pour la continuité de x 7→ Maxy∈B K(x, y) et de façon similaire
de y 7→ Maxx∈A K(x, y).
Dans le cas où f est bilinéaire, ce résultat s'appelle le théorème du min-max de von Neumann. Il
a une signication en théorie des jeux. Si f donne la valeur que gagne un joueur A en position x ∈ U
si f (x) ≥ 0 et −f (x) la valeur que gagne le joueur B (et perd le joueur A) si f (x) ≤ 0. Si A ne peut
inuencer que la direction {0} × IRk et B seulement la direction IRn−k × {0}. Alors un point selle est
un "équilibre de Nash" c'est-à-dire un point où ni A ni B n'ont intérêt à changer leur stratégie, car
si A change sa stratégie celle de B étant constante, étant donné que le point selle est un maximum,
A va perdre en gain, et de même si B change sa position avec celle de A constante, le caractère de
minimum dans la direction du changement de B montre que B ne peut que perdre plus.
Démonstration. • Maxy∈B Minx∈A K(x, y) ≤ Minx∈A Maxy∈B K(x, y) est toujours vrai. Comme
pour tout x ∈ A, y ∈ B , Minx∈A K(x, y) ≤ K(x, y) ≤ Maxy∈A K(x, y), on déduit en prenant le
max : Maxy∈B Minx∈A K(x, y) ≤ Maxy∈B K(x, y) soit en prenant un M in en x :
En prenant x = x0 , y = y 0 , on voit α = K(x0 , y0 ), ce qui dit donc que (x0 , y0 ) est un point
selle.
115
• Montrons (B.2). Considérons, pour ϵ > 0,
Comme x 7→ ϵ||x||22 est strictement convexe, il en est de même de Kϵ (., y) pour tout y ∈B
(convexe plus strictement convexe donne strictement convexe).
Montrons que pour tout y , la fonction Kϵ (., y) a un unique minimum. En eet, si x1 ̸= x2 sont
deux minima, par stricte convexité : Kϵ ((x+y)/2, y) < Kϵ (x1 , y)/2+Kϵ (x2 , y)/2 = K(xi , y) en
contradiction avec le caractère de minimum. Donc on a un unique E(y) atteignant le minimum
de Kϵ (., y) Par le deuxième point (appliqué à −Kϵ (y, x)) fϵ (y) = Kϵ (E(y), y) est continue,
∗ ∗
donc atteint son maximum en y . En conséquence, par la dénition de fϵ et le choix de y
Kϵ (x, (1 − t)y ∗ + ty) ≥ (1 − t)Kϵ (x, y ∗ ) + tKϵ (x, y) ≥ (1 − t)fϵ (y ∗ ) + tKϵ (x, y).
En prenant x = E((1 − t)y ∗ + ty), on obtient fϵ ((1 − t)y ∗ + ty) ≥ (1 − t)fϵ (y ∗ ) + tKϵ (E((1 −
∗
t)y + ty), y).
∗
Vu que y maximise fϵ , en soustrayant et divisant par t, on a :
Or par dénition Kϵ (E(y)), yϕ(n) ) ≥ Kϵ (E(yϕ(n) )), yϕ(n) ) donc en passant à la limite Kϵ (E(y), y) ≥
Kϵ (Z, y) > Kϵ (E(y), y), une contradiction.
On a donc montré la continuité de y 7→ E(y).
∗ ∗
Donc en passant à la limite dans l'inégalité (∗), on obtient : fϵ (y ) ≥ Kϵ (E(y ), y) et ce pour
∗ ∗ ∗ ∗
tout y ∈ B Par ailleurs par dénition de fϵ , fϵ (y ) ≤ Kϵ (x, y ). Autrement dit (E(y ), y ) est
un point selle de Kϵ . Par l'implication (B.1) ⇒ (B.2), on déduit, vu K(x, y) ≤ Kϵ (x, y) ≤
K(x, y) + ϵD (avec D = M axx∈A ||x||22 < ∞ par compacité) :
116
Dénition B.4. Soit E un IR-e.v., un convexe C ⊂ E est dit absorbant si pour tout x ∈ E, x ∈ λC
pour un λ > 0.
C C
µ =µ =µ
5. Si E est un e.v.n. et 0 ∈ Int(C) (ce qui implique C absorbant), µ est continue et de plus
A B C
A = Int(C), B = C.
Corollaire B.8. Soit C un convexe d'intérieur non vide d'un e.v.n., Int(C) = Int(C) et Int(C) =
C.
117
5 Séparation des convexes (Niveau M1)
Un élément f ∈ E ′ tel que f ̸= 0 permet de construire un hyperplan fermé (translation de Ker(ϕ),
voir lemma 2.30) : {x ∈ E, f (x) = c}. Les deux ensembles {x ∈ E, f (x) ≤ c} et {x ∈ E, f (x) ≥ c}
sont des demi-espaces. On dit que deux ensembles sont séparés (par l'hyperplan) si chaque ensemble
est dans un des demi-espaces. On parle de séparation stricte si C1 ⊂ {x ∈ E, f (x) < c} et C2 ⊂ {x ∈
E, f (x) > d} pour d > c.
On va obtenir un résultat de séparation en utilisant un résultat abstrait de prolongement :
Alors il existe une forme linéaire f sur E qui prolonge g (c'est-à-dire ∀x ∈ G, g(x) = f (x)) et
encore dominée par p, c'est-à-dire telle que
∀x ∈ E, f (x) ≤ p(x).
La version suivante du théorème de Hahn-Banach permet de séparer des ensembles convexes bien
choisis.
Théorème B.10. Soient A, B deux convexes non-vides disjoints d'un e.v.n. E, ils sont séparés par
un hyperplan dans les deux cas suivants :
1. Si A est ouvert, alors il existe f ∈ E et c ∈ IR telle que
′
∀x ∈ G, g(x) ≤ µA (x).
En appliquant le théorème, on obtient donc f linéaire étendant g et telle que (en réutilisant la
lipshitzianité obtenue dans la preuve du théorème B.7 (5))
Ceci implique en particulier f ∈ E ∗ , f (x) < 1 pour x∈A et f (x) = 1 sur B. Ce qui donne la
séparation.
118
Second cas : B quelconque.
On pose C = A − B qui est convexe, ouvert (comme union ∪y∈B A − y ) et 0 ̸∈ C . Donc d'après le
′
premier cas il existe f ∈ E telle que f (z) < 0 pour z = a − b ∈ A − B soit f (a) < f (b) pour a ∈ A,
b ∈ B. En passant au sup on obtient :
Comme ||f || =
̸ 0, il sut de prendre c = α − ||f ||ϵ/2 < d = α + ||f ||ϵ/2.
Applications
Il vient de l'application directe au cas A = {x}, B = {y} qui sont des compacts.
F ⊥ := {f ∈ E ′ , f (x) = 0x ∈ F },
⊥
N := {x ∈ E, f (x) = 0∀f ∈ N }.
119
Démonstration.
⊥
En eet, y ∈ Ker(T t ) ssi pour tout x ∈ E , 0 = [T t (y)](x) = y(T (x)) ssi y ∈
[Im(T )] .
De même, y ∈ Ker(T ) ssi pour tout x ∈ E ∗ , 0 = x[T (y)] = [T t (x)(y) ssi y ∈ ⊥ [Im(T t )].
Démonstration. T Pour 1,
t
Im(T ) = Ker(T ) = 0
est injectif si et seulement si
⊥ t
(proposition B.13)
ssi Im(T )
est dense par la proposition précédente.
⊥ ⊥
Pour 2, X ⊂ (X ) donc comme le terme de droite est fermé, l'adhérence est inclus. Récipro-
′
quement, soit x ̸∈ X par la conséquence de Hahn-Banach ci-dessus, soit f ∈ E telle que f (x) = 1,
⊥ ⊥ ⊥
et f ∈ X , on déduit que x ̸∈ (X ).
Le résultat suivant qu'on a utilisé pour les calculs de cônes normaux est un exercice typique
d'application de Hahn-Banach.
Proposition B.15. Soit {f : i = 1, 2, · · · , k} un ensemble ni dans E (pour un e.v.n. E). Les ′
(1) Il n'y a aucun v ∈ E tel que f (v) < 0 pour tout i ∈ [1, n] ;
(2) L'ensemble {f : i = 1, 2, ..., k} est positivement linéairement dépendant : il existe un vecteur
i
K1 = {y ∈ IRk : yi < 0, ∀i ∈ {1, 2, ..., k}}, K2 = {(f1 (v), f2 (v), ..., fk (v)) : v ∈ E}.
k
Vu que pi (y) = yi est linéaire sur IR de dimension nie, donc convexe continue, on obtient que
k −1
K1 = ∩i=1 pi (] − ∞, 0[) est une intersection nie de convexes ouverts, donc un convexe ouvert.
K2 = Im(f1 , · · · , fk ) ∋ 0 est un s.e.v de IRk , donc un convexe non-vide. (1) indique qu'ils sont
′ k
disjoints. Par conséquent le cas 1 du théorème B.10 s'applique et donne λ = (λ1 , · · · , λk ) ∈ E = IR
et c tels que :
∀x ∈ K1 , y ∈ K2 , ⟨λ, x⟩ < c ≤ ⟨λ, y⟩
.
CommeK2 est un s.e.v., pour t → 0 on a c ≤ t⟨λ, y⟩ → 0, donc c ≤ 0. De plus c ≤ ±n⟨λ, y⟩ et
|c|
donc ±n⟨λ, y⟩ ≤ −c = |c| force |⟨λ, y⟩| ≤ → 0 doncP⟨λ, y⟩ = 0.
n
1 1 1
De plus (− , · · · , −1, · · · , − ) ∈ K1 so −λi − j̸=i λj < c ≤ 0. Donc en passant à la limite,
n n n
n → ∞, on obtient −λi ≤ 0, donc λi ≥ 0. Et λ ̸= 0 vient de ⟨λ, (1, · · · , 1)⟩ < 0.
120
Annexe C
Espaces mesurés.
Dénition C.1. Une classe monotone surΩ est une famille M de partie de Ω contenant Ω et stable
par diérence et unions croissantes, c'est-à-dire M ⊂ P(Ω) telle que :
1. Ω∈M
2. Si A, B ∈ M avec B⊂A alors A − B ∈ M.
[
3. Si {An , n ≥ 0} ⊂ M est une suite croissante (i.e. An ⊂ An+1 , alors An ∈ M.
n≥0
On peut donc parler de la plus petite classe monotone contenant une famille A ⊂ P(Ω), qui est
i∈I
l'intersection de toutes les classes contenant A, elle est notée M(A) et appelée la
A.
classe monotone
engendrée par
121
Démonstration. Par le lemme C.1 1), σ(E) est une classe monotone contenant E , donc comme M(E)
est la plus petite telle classe, on a M(E) ⊂ σ(E).
M(E) est une tribu. Par le lemme C.1 2), il sut de voir que M := M(E) est stable par
intersection binaire. On pose
K = {A ∈ M : ∀B ∈ E, A ∩ B ∈ M}.
L = {A ∈ M : ∀C ∈ M, A ∩ C ∈ M}.
On montre comme avant que L est une classe monotone (exo). Montrons que E ⊂ L. Soit donc
B ∈ E , alors C ∈ M ⊂ K donc, par dénition de K, pour B ∩ C ∈ M. Et comme c'est vrai pour
tout C ∈ M, on en déduit par dénition de L que B ∈ L, comme voulu.
Finalement, L est une classe monotone telle que E ⊂ L ⊂ M(E) donc, par dénition de la classe
monotone engendrée, L = M(E).
Inclusion réciproque. Comme M(E) est une tribu contenant E et que σ(E) est la plus petite
telle tribu, on obtient M(E) ⊃ σ(E).
Corollaire C.3. (au lemme de classe monotone) Soient µ et ν des mesures nies de mêmes masses
(i.e. µ(Ω) = ν(Ω)) sur un espace mesurable (Ω, T ). Soit E une famille stable par intersection nie
qui engendre T . Si µ et ν coïncident sur E (i.e. µ(E) = ν(E), ∀E ∈ E ) alors µ et ν sont égales (i.e.
µ(B) = ν(B), ∀B ∈ T ).
[ [
µ An = lim µ(An ) = lim ν(An ) = ν An .
n→∞ n→∞
n≥1 n≥1
Bilan, M est une classe monotone qui contient E, donc M(E) ⊂ M. Or par le lemme de classe
monotone M(E) = σ(E) = T d'où le résultat.
122
S
monotone pour les mesures nies, on déduit
S µn = νn . Pour tout B ∈ T, on a B = B ∩ ( n An ) =
n (B ∩ An ) donc par union croissante :
Dans le cas où la suite An n'est pas croissante, on utilise Bn = ∪ni=1 Ai qui est une suite croissante,
mais pas forcément dans E , donc il faut travailler plus pour vérier l'hypothèse pour la mesure induite
sur Bn . D'abord, par la formule de Poincaré :
n
X X
µ(∪nk=1 Ak ) = (−1)k−1 µ(Ai1 ∩ · · · ∩ Aik ) < +∞.
k=1 1≤i1 <···<ik ≤n
Et comme toutes les intersections sont dans E tous les termes de la formule sont égaux aux termes cor-
respondants pour ν donc µ(Bn ) = ν(Bn ). On considère les mesures induites pour B ∈ T (E),µn (B) =
µ(B ∩ Bn ), ν(B ∩ Bn ) = νn (B). On vient de voir que µn , νn sont nies. Montrons que pour E ∈ E
µn (E) = νn (E) En eet E ∩ Bn = ∪nk=1 (E ∩ Ak ) et en appliquant la formule de Poincaré encore (en
remarquant que les intersections sont celles d'éléments de E .
n
X X
µ(∪nk=1 (E ∩ Ak )) = (−1)k−1 µ(E ∩ Ai1 ∩ · · · ∩ Aik )
k=1 1≤i1 <···<ik ≤n
Xn X
= (−1)k−1 ν(E ∩ Ai1 ∩ · · · ∩ Aik ) = ν(∪nk=1 (E ∩ Ak )).
k=1 1≤i1 <···<ik ≤n
On conclut comme avant du corollaire au lemme de classe monotone pour les mesures nies, que
S S
µn = νn . Puis pour tout B∈T, on a B =B∩( n Bn ) = n (B ∩ Bn ) donc par union croissante :
Remarque . C.1 Il existe des ensembles qui ne sont pas boréliens sur IR, et donc des fonctions non-
boréliennes. Ils ne sont pas si faciles à dénir, donc en pratique, tous les ensembles qu'on rencontrera
seront boréliens.
123
Démonstration. On peut supposer F non-vide, sinon, c'est évident (la partie vide donc nie est
dense). On xe donc x0 ∈ F
Soit un une suite dénombrable dense. Soit am,n ∈ B(um , 1/n) ∩ F si cet ensemble est non-vide,
et sinon on pose am,n = x0 . La famille {am,n , m, n ∈ IN} est nie ou dénombrable et dense car si
x ∈ F il existe d(um , x) < 1/2n donc am,2n existe car B(um , 1/2n) ∩ F est non vide et par inégalité
triangulaire d(um , am,2n ) < 1/n.
⌊pxi ⌋ 1
− xi ≤
p p
n n n n
donc ||xp − x||∞ ≤ 1/p →p→∞ 0. Donc vu xp ∈ Q
l , x ∈ Q
l . Comme x est arbitraire. IR ⊂Q
l
CQFD.
[
U= B(xn , rn ) ∈ σ B : Boule ouverte de X
(xn ,rn )∈A
Soit x ∈ U , il existe r > 0 avec B(x, r) ⊂ U . Puis il existe n tel que d(x, xn ) < 3r et soit rn ∈ Q
l
avec r/3 < rn < r/2 (par densité de Q l dans IR= donc x ∈ B(xn , r/3) ⊂ B(xn , rn ) ⊂ B(xn , r/2) ⊂
S
B(x, r) ⊂ U donc (xn , rn ) ∈ A et x ∈ (xn ,rn )∈A B(xn , rn ). Comme x est arbitraire, on a l'insclusion
[
réciproque qui conclut : U ⊂ B(xn , rn ).
(xn ,rn )∈A
124
usuelle vu qu'on a les mêms ouverts, cf TD 1) et que les ensembles de la partie génératrice sont les
boules ouvertes pour dR .
\ 1 1i
Il sut de noter que ]a, b[= a − ,b + ∈ σ {{+∞}, {−∞}} ∪ {[a, b] : a < b} pour
n≥1
n n
déduire que
B(R) = σ {{+∞}, {−∞}} ∪ {[a, b] : a < b}
Par le lemme 4.13, on a alors que f est mesurable si et seulement si
−1
1. f ({∞}) ∈ T
2. f −1 ({−∞}) ∈ T
3. Pour tout a < b ∈ IR, f −1 ([a, b]) ∈ T
C'est exactement le résultat voulu (et on a vu que le dernier point équivaut à la mesurabilité de la
restrition de f à IR.
En conséquence, (C (K, IR), ||.|| ) est séparable et sa tribu borélienne B(C (K, IR)) est dénom-
0 0
brablement engendrée (c'est à dire admet une partie génératrice au plus dénombrable).
∞
n
Y
n
B(IR )=σ ]ai , bi [, ai < bi ∈ IR .
i=1
Comme les produits d'intervalles ouverts sont des ouverts, et que les boules ouvertes pour la norme
inni sont des boules ouvertes, on a
( n )
Y
n
{B : Boule ouverte de IR , || · ||∞ } ⊂ ]ai , bi [, ai < bi ∈ IR ⊂ T .
i=1
n
Donc en prenant la tribu engendrée et en appliquant la proposition C.6 sachant que IR est
séparable par la proposition C.5, on obtient :
n
Y
n n
B(IR ) = σ {B : Boule ouverte de IR , || · ||∞ } ⊂ σ ]ai , bi [, ai < bi ∈ IR ⊂ σ T = B(IRn ).
i=1
125
3 Stabilité des fonctions mesurables
Lemme C.8. Un supremum d'une suite f n : (Ω, T ) → R de fonctions mesurables est mesurable.
Démonstration. f = sup
On note f n≥1 n et on remarque que
Or par le corollaire 4.17, on sait quefn−1 ({−∞} est dans T et aussi fn−1 (]−∞, a]) = ∪n≥1 fn−1 ([−n, a]) ∈
T par union dénombrable. Donc chaque fn−1 ([−∞, a]) ∈ T et donc par intersection dénombrable, on
−1
a f ([−∞, a]) ∈ T . Par le corollaire 4.16, on déduit que la restriction de f à IR est mesurable et
−1
donc pour tout a < b, on a f ([a, b]) ∈ T . \
−1
Enn, f ({−∞}) = ∩n≥1 fn ({−∞}) ∈ T et f −1 ({+∞}) =
−1
f −1 (]n, +∞]) ∈ T . Or f −1 (]n, +∞]) =
n≥1
f −1 ([−∞, n])c ∈ T donc par intersection dénombrable, on a bien f−1
({+∞}) ∈ T . Par la réciproque
du corollaire 4.17, on déduit que f est mesurable.
Lemme C.9. La lim sup, lim inf d'une suite f n : (Ω, T ) → R de fonctions mesurables est mesurable.
Démonstration. inf f = − sup −f
Comme n n
n n , on déduit qu'un inmum d'une suite de fonctions
mesurables est mesurable. Or, comme rappelé au chapitre précédent,
est donc mesurable en utilisant le résultat du lemme précédent sur le suprémum (ou l'innimum) de
fonctions mesurables.
Proposition C.10. Une limite simple d'une suite f : (Ω, T ) → R de fonctions mesurables est
mesurable.
n
Démonstration. Si une suite converge simplement, on a limn→∞ fn = lim supn fn qui est donc mesu-
rable par le lemme précédent.
Démonstration. f = X a 1 ,
n
Pour i Ai il existe toujours une (unique) représentation canonique de f en
i=1
voyant b1 < · · · < bm tel que l'image f (Ω) − {0} = {b1 , · · · , bm } et en prenant Bi = f −1 ({bi }) ∈ T
Xn
car f est mesurable. Alors, on a f (ω) = bi 1Bi (ω). Comme les Ai sont 2 à deux disjoints, on voit
i=1
126
X
Bj comme union disjointe de Ai et donc µ(Bi ∩ B) = µ(Aj ∩ B) donc, en regroupant par
{j:aj =bi }
paquet :
Z n
X m
X X m
X
f dµ = ai µ(Aj ∩ B) = bi µ(Ai ∩ B) = bi µ(Bi ∩ B).
B j=1 i=1 {j:aj =bi } i=1
On obtient donc :
Z m X
X n m X
X n Xm X
n Z Z
f +hdµ = (ai +bj )µ(Ai ∩Bj ) = ai µ(Ai ∩Bj )+ bj µ(Ai ∩Bj ) = f dµ+ hdµ.
B j=0 i=0 j=0 i=0 j=0 i=0 B B
Si 0 ≤ f ≤ h alors h = (h − f ) + f est la
R4. R R R somme de deux fonctions étagées positives et par le
3,
B
f dµ ≤ B f dµ + B (h − f )dµ = B hdµ.
B
f dµ ≤ 1
Ω B
f dµ.
En sens inverse, g étagée positive avec g ≤ 1B f ≤ f vérie donc g1B = g et par dénition
R R R R R R
Ω
gdµ = Ω g1B dµ = B gdµ ≤ B f dµ soit en passant au sup Ω 1B f dµ ≤ B f dµ. R
Le cas particulier vient du 1. appliqué à l'inéaglité 1A f ≤ 1B f sous la forme : 0 ≤ f dµ =
R R R A
1 f dµ ≤ Ω 1B f dµ = B f dµ.
Ω 1
3. Si c = 0 c'est évident, on suppose donc c > 0. Alors pour g ≤ f avec g étagée positive, on a
R R R
cg ≤ cf donc par le cas étagé du lemme 4.20, on a c B gdµ = B cgdµ ≤ B cf dµ. En passant au
sup, on a obtenu : Z Z
c f dµ ≤ cf dµ
B B
127
mais en appliquant ) cf à la place de f f = 1c cf , on obtient :
et
Z Z Z
1 1
cf dµ ≤ c f dµ = f dµ
c B B c B
R R
d'où l'inégalité dans l'autre sens
B
cf dµ ≤ c B f dµ et donc l'égalité.
4. Si f = 0 0 ≤ g ≤ f implique g = 0 et en passant au sup de 0, on obtient le résultat.
R R Pn R Pn
Si µ(B) = 0,
B
gdµ = Ω
1B gdµ et si g(ω) = i=1 a i 1A i
(ω) , on a
Ω
1B gdµ = i=1 ai µ(B ∩ Ai ) =
0 car chaque µ(B ∩ Ai ) ≤ µ(B) = 0.
5. Si on a 0 ≤ g ≤ f , 0 ≤ k ≤ h avec g, k mesurable positive, alors g + k ≤ f + h est mesurable
R R R R
positive, donc
B
f + hdµ ≥ B g + kdµ = B gdµ + B kdµ. En passant au sup, on obtient le résultat.
128
Annexe D
au chapitre 6 : Espaces Lp
Proposition D.1. Soit µ σ-nie, p ∈ [1, ∞], q tel que 1/p + 1/q = 1 le coecient conjugué, alors
pour tout g mesurable
Z
||g||q = sup{ f gdµ ; ||f ||p ≤ 1, f g ∈ L1 (Ω, µ), f ∈ L1 (Ω, µ) ∩ L∞ (Ω, µ)}.
Proof :
q
Soit croissant telle que ∪An = Ω, µ(An ) < ∞. On commence par le cas g ∈ L (Ω, µ).
An
1
Par Hölder, f g ∈ L donc l'intégrale est dénie (avec la condition ||f ||p ≤ 1 seule) et
Z
| f gdµ| ≤ ||f g||1 ≤ ||f ||p ||g||q
d'où ||g||q est plus grand que le sup de l'énoncé. Mais, pour p ∈]1, ∞[, si on prend f = g|g|q−2 /||g||q−1 q
p p(q−1) p(q−1)
on a |f | = |g| /||g||q = |g|q /||g||qq car p(q − 1) = qp(1 − 1/q) = q , donc f ∈ Lp et ||f ||pp =
E(|f |p ) = ||g||qq /||g||qq = 1. Donc ||f 1An ||pp ≤ ||f ||pp ≤ 1 donc comme Lp (An , µ) ⊂ L1 (An , µ) car
µ(An ) < ∞ on a f 1An ∈ L1 (Ω, µ) et donc
f 1An
gn,m (f ) = 1{f 1An ̸=0} min(m, |f 1An |) ∈ L∞ (Ω, µ) ∩ L1 (Ω, µ)
|f 1An |
d'où le sup est supérieur à
Z Z Z
gn,m (f )gdµ →m→∞ f 1An gdµ →n→∞ f gdµ
R R
(par convergence dominée par |gn,m (f )g| ≤ |f g|) et le sup est supérieur à f gdµ = |g|q dµ/||g||q−1
q =
||g||q . On déduit donc l'égalité énoncée.
p = 1, q = ∞, soit C > sup{ f gdµ ; ||f ||1 ≤ 1f g ∈ L1 (Ω, µ), f ∈ L1 (Ω, µ) ∩ L∞ (Ω, µ)} et
R
Si
A = {x : |g(x)| > C}. Supposons par l'absurde que µ(A) > 0 soit B ⊂ A avec µ(B) ∈]0, ∞[.
129
g
L∞ )
R
Alors f = 1B |g|µ(B) est dans L1 et ||f ||1 = 1 (et borné par 1/µ(B) donc dans mais f gdµ =
R |g|
1B µ(B) ≥ C en contradiction avec le choix de C donc µ(A) = 0 ce qui implique ||g||∞ ≤ C ce qui
donne le résultat en prenant l'inf des C .
g
Si p = ∞, q = 1, il sut de prendre f = 1g̸=0 |g| ∈ L∞ (Ω) et f 1An ∈ L∞ (Ω) ∩ L1 (Ω) de sorte que
R
f 1An g = |f |1An et la norme ||f 1An ||∞ ≤ 1. Donc le supremum, est supérieur à |f |1An dµ → ||f ||1
par convergence monotone.
g
Si on ne suppose plus g ∈ Lq (Ω, µ) mais ||g||q = ∞. Soit alors gn,m = 1{g̸=0} |g| min(m, |g|)1An ∈
∞
Lq (Ω, µ) on obtient
1 p
fn,m,k ∈ L ∩ L de norme ≤ 1 dans L tel que
Z
| fn,m,k gn,m | →k→∞ ||gn,m ||q .
par convergence monotone car | min(|g|, m) − |g||q décroit vers 0, on trouve une suite mk tel que
Z
| fn,mk ,k g1An | →k→∞ ||g1An ||q
(ni ou inni). Enn comme par convergence monotone ||g1An ||q → ||g||q , on trouve une suite
Z
| fnk ,mk ,k g1An | →k→∞ ||g||q = ∞.
Comme ||fnk ,mk ,k 1An ||p ≤ 1, et fnk ,mk ,k 1An ∈ L1 ∩ L∞ et fnk ,mk ,k g1An ∈ L1 cela donne la solution :
Z
sup{ f gdµ ; ||f ||p ≤ 1, f g ∈ L1 (Ω), f ∈∈ L1 ∩ L∞ } = ∞ = ||g||q .
Exemple . D.1 Dans le cas où µ est la mesure de comptage sur I (σ -nie si I dénombrable), µ(A) =
Card(A), on obtient l'espace ℓp (I, IK) des suites indicées par I de puissance p sommable, i.e. telles
que
X
|xi |p < ∞
i∈I
pour p = ∞.
130
Lemme D.2. Soit (Ω, µ, T ) un espace σ-ni. L'ensemble S des fonctions étagées intégrables est
dense dans tous les L (Ω, µ, T ), 1 ≤ p < ∞. En particulier, L (Ω, µ, T ) ∩ L (Ω, µ, T ) est dense dans
p 1 ∞
Démonstration. Cela vient de la construction de l'intégrale, et du fait que les fonctions étagées
1 ∞
sont dans L (Ω, µ, T ) ∩ L (Ω, µ, T ), mais rappelons une preuve. En décomposant en parties réelle
p
et imaginaire puis parties positive et négative, on se ramène à approcher f ∈ L avec f ≥ 0. Si
Ω = ∪An µ(An ) < ∞, on a ||f 1An − f ||p → 0 par convergence dominée, donc on prend h = f 1Am .
On prend
4 n 4 n
X k X k
hn (x) = 1[ kn , k+1n [
(h(x)) = 1 −1 k k+1 (x) ≤ h(x)
k=0
2n 2 2
k=0
2n h ([ 2n , 2n [)
Comme h mesurable, il est facile de voir que h ∈ S,
1
||h − hn ||p ≤ ||h1h(x)≥2n ||p + ||1h(x)≤2n 1Am ||p
2n
et le premier terme tend vers 0 par convergence dominée (par |h|p ), le second car µ(Am )1/p < ∞.
Donc h puis f sont dans l'adhérence.
Pour obtenir un résultat de densité des fonctions continues, on a besoin d'un résultat de continuité
sur un grand ensemble pour les fonctions mesurables. On a besoin d'une compatibilité entre théorie
de la mesure et topologie qui fait l'objet de la dénition suivante. L'essentiel est que la mesure de
n
Lebesgue sur IR est un exemple de mesure de Radon, ainsi que toutes les mesures à densité par
rapport à la mesure de Lebesgue (et aussi les mesures discrètes).
Dénition D.1. Une mesure de Radon positive sur X localement compact est une mesure positive
dénie sur une tribu T contenant la tribu borélienne B et telle que :
Théorème D.3 (de prolongement de Tietze). (exo en section A) Soit X un espace métrique, F un
fermé de X et f : F → IR une fonction continue bornée par C , alors il existe une fonction g : X → IR
bornée par C et prolongeant f .
On rappelle qu'un espace topologique est ditlocalement compact si tout point a un voisinage
(d'adhérence) compact. [Rmq : pour nous, un voisinage d'un point n'est pas forcément ouvert, c'est
n
seulement un ensemble contenant un ouvert contenant le point] Par exemple c'est le cas de X = IR !
131
Lemme D.4 (d'Urysohn). Si X est un espace métrique localement compact, V un ouvert contenant
un compact K , alors il existe f continue à support compact tel que 1 ≤ f ≤ 1 . K V
Théorème D.5 (de Lusin). Soit X un espace métrique localement compact. µ une mesure de Radon
positive. Soit f une fonction complexe mesurable sur X s'annulant en dehors de A avec µ(A) < ∞.
Alors, pour tout ϵ > 0, il existe g continue à support compact avec sup |g(x)| ≤ sup |f (x)| et
telle que : x∈X x∈X
2n
X k
fn (x) = 1 k k+1 (f (x)) ≤ fn+1 (x) ≤ f (x).
k=0
2n [ 2n , 2n [
1
P2n+1 1
Remarquons que tn := fn+1 (x) − fn (x) = 2n+1 k=0 1[ 2k+1 2k+2 (f (x)) =
n+1 , n+1 [
1 , (f−1
2n+1 Tn
:= 0) avec
2 2
Tn ⊂ A de sorte que :
∞
X
f (x) = tn (x).
n=−1
Comme dans la preuve du lemme d'Urysohn, il existe un ouvert A ⊂ V avec V compact, puis par
Vn ouvert avecTn ⊂ Vn ⊂ V et enn par intérieure régularité sur les
régularité extérieure, on trouve
−n−2
ensembles de mesures nies Kn ⊂ Tn avec µ(Vn − Kn ) ≤ 2 ϵ. Par le lemme d'Urysohn, on trouve
hn continue à support compact avec 1Kn ≤ hn ≤ 1Vn . On pose
∞
X
g(x) = 2−n−1 hn (x).
k=−1
Par convergence uniforme (car normale) de la série, g est continue, à support compact car inclus
−n−1
dans V . Enn 2 hn (x) = tn (x) sauf sur Vn − Kn donc f = g sauf sur ∪n (Vn − Kn ) qui est de
mesure au plus ϵ
Cas A quelconque, 0 ≤ f ≤ 1. Par régularité, on prend A ⊂ V ouvert, K⊂V compact avec
c c c
µ(A ∩ K ) ≤ µ(V ∩ K ) ≤ ϵ/2 et on applique à f 1K (vu {f 1K ̸= f } ⊂ A ∩ K ) le cas précédent en
remplaçant ϵ par ϵ/2.
Cas général Soit Bn = {x|f (x)| > n} de sorte que ∩Bn = ∅, comme µ(B1 ) < ∞ en utilisant le
TCM sur 1B1 −1Bn , µ(Bn ) → 0, on applique à (1−1Bn )f en décomposant la fonction en somme de 4n
fonctions à valeur [0, 1] (4 pour décompositions en parties positives, négatives des parties imaginaires
et réelles, et ces fonctions sont dans [0, n] d'où la décomposition en somme de n fonctions à valeurs
[0, 1]). Enn pour avoir l'inégalité on remplace g par ϕ ◦ g avec ϕ(x) = x, |x| ≤ R = supx∈X |f (x)| ,
ϕ(x) = Rx/|x|, |x| > R. On a g(x) = ϕ ◦ g(x) pour tout x tel que f (x) = g(x), donc on n'augmente
pas l'ensemble sur lequel f et g dièrent.
132
Corollaire D.6. Soit (X, µ, T ) un espace métrique localement compact avec µ mesure de Radon σ-
nie. L'ensemble C (X) des fonctions continues à support compact est dense dans tous les L (X, µ, T ), p
Démonstration. S
Par le lemme précédent, il sut d'approcher les éléments de . Par le théorème de
Lusin D.5, pour chaque f ∈ S , ϵ > 0, on a g ∈ Cc (X) avec µ(g ̸= f ) ≤ ϵ et sup |g| ≤ sup|f | = C donc
||f − g||p ≤ 2Cµ(g ̸= f )1/p et cette quantité est arbitrairement petite. Pour R le résultat d'annulation,
q
si p > 1, On utilise la densité dans L , q exposant conjugué, pour obtenir f g = 0 pour g ∈ Lq , d'où
on déduit ||f ||p = 0 par la proposition D.1. Si p = 1, on remplace f par f |V avec V ouvert V compact,
qui couvrent X par locale compacité de sorte qu'on peut supposer µ(X) < ∞. On peut supposer f
−1 −1
réelle. Soit f1 ∈ Cc (X) avec ||f − f1 ||1 ≤ ϵ, K1 = f1 ([ϵ, ∞[) et K−1 = f1 (] − ∞, ϵ]) sont compacts,
on prolonge par le Théorème de Tietze D.3, u ∈ Cc (X) valant ϵ sur Kϵ et soit K = K1 ∪ K−1 . Donc
Z Z Z Z Z
||f1 ||1 = f1 u + |f1 | ≤ f1 u + 2 |f1 | ≤ ϵ + f u + 2µ(X − K)ϵ ≤ ϵ + 2µ(X)ϵ
K X−K X X−K X
car |f1 | ≤ ϵ sur X − K. Donc ||f ||1 ≤ 2ϵ + 2µ(X)ϵ pour tout ϵ>0 ce qui donne f = 0.
Donnons une application.
translation τ : L (IR ) → L (IR ) est isométrique et pour tout f ∈ L (IR ) h 7→ τ (f ) est continue
h
p d p d p d
de IR → L (IR ).
h h
d p d
Démonstration. L'isométrie est évidente par invariance de la mesure de Lebesgue par translation.
Montrons que ||τh f − f ||p →h→0 0. En eet pour ϵ > 0, par densité du lemme D.6, on trouve
f1 ∈ Cc (IRd ) avec ||f1 − f ||p ≤ ϵ/3 donc comme τh est une isométrie : on obtient :
||τh f −f ||p ≤ ||τh f1 −τh f ||p +||τh f1 −f1 ||p +||f1 −f ||p ≤ 2ϵ/3+Leb(B(0, ||h||)+Supp(f1 ))1/p ||τh f1 −f1 ||∞
Pour h assez petit, comme f1 est uniformément continue (car continue à support compact et
par le Théorème de Heine), on peut trouver 1 ≥ δ > 0 de sorte que si ||h|| ≤ δ , ||τh f1 − f1 ||∞ =
supx |f1 (x + h) − f1 (x)| ≤ ϵ/[3Leb(B(0, 1) + Supp(f1 ))1/p ] ce qui conclut.
On a même le théorème suivant (on notera que p<∞ contrairement au cas de la formule pour
la norme ) :
Théorème D.8. (de représentation de Riesz L ) Soit l'application dénie grâce à l'inégalité de
p
Hölder :
Z
q p
I : f ∈ L (Ω, µ) 7→ (g ∈ L (Ω, µ) 7→ f gdµ)
Alors I : L (Ω, µ) → (L (Ω, µ)) , réalise une isométrie SURJECTIVE pour p ∈ [1, ∞[ et q exposant
q p ′
⟨T x, y⟩ = ϕ(xy)
||T || := sup{||T x||2 , ||x||2 ≤ 1} = sup{|⟨T x, y⟩|, ||x||2 ≤ 1, ||y||2 ≤ 1} ≤ ||ϕ||L1 (Ω)′ .
La première égalité est la dénition de la norme des applications linéaires bornées, la deuxième est
le résultat de dualité du cas p = 2, la troisième utilise Hölder et la dénition de la norme du dual.
∞
Notons que si z ∈ L (Ω),
où on a utilisé à la deuxième égalité la commutation avec m|g|1/2 . On voit donc par la formule de
la proposition D.1 que ||T (1An )||∞ ≤ 1. Comme T (1Am ) = T (1Am 1An ) = 1Am T (1An ) donc on dénit
g(x) = T (1An )(x) pour x ∈ An de façon cohérente de sorte que g1An = T (1An ) d'où ||g||∞ =
supn ||g1An ||∞ ≤ 1.
∞ 1 2 2
Et pour z ∈∈ L ∩ L ⊂ L T (z1An ) = mg (z1An ) donc par densité dans L T = mz . Enn pour
1 1/2 2
f ∈ L (Ω) f = |f | g avec g ∈ L , on obtient
ϕ(f ) = ϕ(|f |1/2 g) = ⟨T (|f |1/2 ), g⟩ = ⟨z(|f |1/2 ), g⟩ = I(z)(|f |1/2 g) = I(z)(f ).
134
P Q
Par l'inégalité d'Young (cas particulier d'Holder utilisé dans sa preuve) |ab| ≤ a /P +b /Q utilisé
1/P 1/Q
avec 1/P + 1/Q = 1, P = p/2, Q = p/(p − 2), a = ||x||2 /ϵ , b = (ϵ||x||∞ )1/Q , on obtient :
ϵ 1
|ϕ(x)| ≤ ||x||∞ + P/Q ||x||2 .
Q Pϵ
En incluant {(x, x), x ∈ (L∞ (Ω))} ⊂ L∞ (Ω) × L2 (Ω) avec norme ||(x, y)|| = Qϵ ||x||∞ + P ϵP/Q
1
||y||2
∞ 2 ∞ ′ 2
on étend par Hahn Banach ϕ à L (Ω) × L (Ω) donnant un élément de (ϕ1 , ϕ2 ) ∈ L (Ω) × L (Ω)
1 P/Q
avec ||ϕ1 || ≤ ϵ/Q, ||ϕ2 || ≤ (car en calculant la norme duale on a max(Q||ϕ1 ||/ϵ, P ϵ ||ϕ2 ||) ≤
P ϵP/Q
1
1) Donc ||ϕ|L (Ω) − J(ϕ2 )||(L (Ω)) = ||ϕ1 ||(L (Ω)) ≤ ϵ/Q et ϕ2 ∈ L (Ω). Or par le cas p = 1,
∞ ∞ ′ ∞ ′
(L1 (Ω))′′ = L∞ (Ω)′ et il contient L1 (Ω) comme espace fermé isométriquement via J (comme tout
espace de Banach est inclus isométriquement comme espace fermé dans son bidual). Comme le
(L1 (Ω))′′ 1
résultat précédent indique ϕ ∈ L2 (Ω) , on déduit ϕ ∈ J(L (Ω)) comme voulu. On a donc une
∞
fonction g telle que pour tout f ∈ L (Ω)
Z
ϕ(f ) = gf dµ
Ω
Soit donc g l'image dans L1 de ϕ (on revient au cas général p ∈]1, ∞[)Or dans le cas d'un espace
avec mesure nie, l'équation de la proposition D.1 donne : ||ϕ||(Lp )′ = sup{|ϕ(x)|, ||x||p ≤ 1, x ∈
L∞ } = sup{| gxdµ|, ||x||p ≤ 1, x ∈ L∞ } = ||g||q
R
q ∞
On déduit donc g ∈ L comme on voulait et ϕ = T (g) (en étendant la relation depuisL (Ω) par
p
densité dans L (Ω).
(3)cas 1<p<∞ et
µ σ -ni. p ′
Soit ϕ ∈ (L (Ω, µ)) , il faut montrer qu'elle vient d'un élément
q p p
de L (Ω, µ). On pose ϕn (f ) = ϕ(f 1An ) pour f ∈ L (An , µ) ⊂ L (Ω, µ). Par le cas précédent, il existe
q
gn ∈ L (An , µ) telle que Z
p
∀f ∈ L (An , µ), gn f dµ = ϕ(f 1An ).
||gn ||q = sup{|ϕ(f 1An )| ; ||f ||p ≤ 1, f ∈ L∞ (An , µ)} ≤ ||ϕ||(Lp )′ < ∞.
Or par unicité dans le cas (2) et vu les An n > m, gn 1Am = gm et donc |gn | est
croissant pour
croissant et g = sup |gn | ||g||q ≤ ||ϕ||(Lp )′ , vu |gn | ≤ |g| et comme
vérie par convergence monotone
gn → g p.s., on déduit par convergence dominée ||gn − g||q → 0 et en passant à la limite gn = g1An .
p
Or f 1An → f dans L et donc par continuité la relation ϕ(f 1An ) = T (g)(f 1An ) devient ϕ(f ) =
T (g)(f ) pour tout f ∈ Lp donc ϕ = T (g).
4 Convolution
Dans cette section, on considère l'espace mesuré (Ω, µ, T ) = (IRd , Leb, B) muni de la tribu bo-
p d p d
rélienne et de la mesure de Lebesgue. On note alors L (IR ) = L (IR , Leb, B). Vu l'accord avec
l'intégrale de Riemann, on note aussi dy = dLeb(y).
f ∗ g dénie par :
convolution
Z
(f ∗ g)(x) =
IR f (x − y)g(y)dy.
d
135
Alors f ∗ g ∈ L (IR ) et :
p d
Démonstration. Si p = ∞, comme |g| ≤ ||g||∞ p.p., f (x − y)g(y) ≤ ||g||∞ |f (x − y)| d'où l'intégrabilité
et la borne souhaitée en intégrant (comme la mesure de Lebesgue est invariante par translation).
On suppose d'abord p = 1 et on utilise le Théorème de Fubini Tonelli pour calculer :
Z Z Z Z Z Z
dx|f |∗|g|(x) = dx dy|f (x−y)||g(y)| = dy dx|f (x−y)||g(y)| = ||f ||1 dy|g(y)| = ||f ||1 ||g||1 < ∞
On déduit du théorème de Fubini que pour presque tout x, y 7→ f (x − y)g(y) est intégrable et on
obtient la borne souhaitée
||f ∗ g||1 ≤ ||f ||1 ||g||1 .
p
Pour 1 < p < ∞, soit q l'exposant conjugué. Du cas p = 1 on déduit y 7→ |f (x − y)||g(y)| est
1 1/p
dans L donc y 7→ |f (x − y)| |g(y)| est dans L pour presque tout x. Or y 7→ |f (x − y)| ∈ Lq
p 1/q
1/p
donc par Hölder, y 7→ |f (x − y)||g(y)| = |f (x − y)| |g(y)|.|f (x − y)|1/q est dans L1 et
Z p Z
p p p/q
|(f ∗ g)(x)| ≤ |f (x − y)||g(y)|dy ≤ |f (x − y)||g(y)| dy ||f ||1 .
p/q p/q
||f ∗ g||pp ≤ ||f ||1 |||f | ∗ |g|p ||1 ≤ ||f ||1 ||g||pp ||f ||1 = ||f ||p1 ||g||pp .
Z Z
(f ∗ g)h = g(fˇ ∗ h).
5 Support de la convolution
Si f continue, Supp(f ) = {x : f (x) ̸= 0}. Le résultat suivant permet d'étendre la dénition aux
fonctions mesurables.
Lemme D.10. Pour f : IR → IK mesurable, soit (ω ) la famille de tous les ouverts tels que, pour
d
chaque i, f = 0 p.p sur ω . Si ω = ∪ ω alors f = 0 p.p. sur ω. De sorte que ω est le plus grand
i i∈I
Démonstration. ω
Il faut écrire
comme union dénombrable car
c
I n'est pas forcément dénombrable.
Soit Kn = {x ∈ ω : ||x|| ≤ n, d(x, ω ) ≥ 1/n} comme la distance à un fermé est continue, on
n
voit que Kn fermé borné de IR (e.v.n de dimension nie) donc est compact et ω = ∪ K . Par
n∈IN n
compacité, Kn , recouvert par une union nie Kn ⊂ ωin,1 ∪ ... ∪ ωin,rn . donc ω = ∪ ω est
n∈IN,j≤rn i,j
union dénombrable d'ouvert sur lesquels f = 0 p.p. d'où le résultat.
136
Proposition D.11. Si f ∈ L (IR ), g ∈ L (IR ) alors :
1 d p d
Supp(f) ⊂ [−C, C] : d
Z
f ∗g = dyf (y)τ−y g.
[−C,C]d
∂ ∂
| f (x − y)g(y)| ≤ || f ||∞ 1K (x − y)g(y),
∂xi ∂xi
R
avec K le compact support de f . Or par Hölder 1B−K (y)|g|(y)dy ≤ Leb(B − K)1/q ||g||p , donc on
a une domination par une fonction intégrable c1B−K g si x ∈ B avec B compact. Le théorème de
d
dérivation 4.39 conclut donc. De plus, par changement de variables linéaire si Supp(f ) ⊂ [−C, C] ,
on a Z Z Z
f ∗ g(x) = d
f (x − y)g(y)dy = d
f (y)g(x − y)dy = f (y)(τ−y g)(x)dy
IR IR [−C,C]d
avec τh (g)(x) = g(x + h). On a vu à la proposition D.7 que y 7→ f (y)(τ−y g) est continue à valeur
Lp (IRd ) on peut donc parler de son intégrale de Riemann, sur [−C, C]d (calculée successivement
p d
variable par variable). On obtient une suite (de sommes de Riemann) qui converge dans L (IR ),
R
donc quitte à extraire une suite qui converge p.p. et donc p.p. la limite
[−C,C]d
dyf (y)(τ−y g) coïncide
R
avec l'intégrale de Riemann
[−C,C]d
dyf (y)(τ−y g)(x) par exemple si g est continue à support compact
137
et cette intégrale vaut l'intégrale de Lebesgue donc f ∗ g(x). On en déduit l'égalité voulue dans Lp
si g
continue à support compact. Or par densité, on a une suite de fonctions gn continues à support
p
compact convergeant dans L vers g . Et comme sup d ||τ−y gn − τ−y g||p → 0, f (.)(τ−. gn ) converge
IR
uniformément vers f (.)(τ−. g) et comme l'intégrale de Riemann est continue pour la convergence
R R
uniforme
[−C,C]d
dyf (y)(τ−y g) est la limite de [−C,C]d dyf (y)(τ−y gn ) dans Lp qu'on a déjà vu valoir
R
f ∗ gn , qui a pour limite f ∗g donc
[−C,C]d
dyf (y)(τ−y g) = f ∗ g.
Lemme D.13. Soit ρ suite régularisante et f ∈ L (IR ) pour 1 ≤ p < ∞. Alors ||ρ
n
p d
n ∗ f − f ||p → 0 .
Démonstration. On a comme ||.||p est une norme on a par l'inégalité triangulaire (de l'intégrale de
Riemann et la proposition D.12) :
Z Z
||ρn ∗ f − f ||p = || dyρn (y)(τ−y f − f )||p ≤ dyρn (y)||τ−y f − f )||p
B(0,1/n)
(vu que pour K, F compacts K + F est compact et en comparant les distances pour la dernière
∞ d
inclusion). Donc ρm ∗ (f 1Kn ) ∈ Cc (IR ). Mais on a vu ||ρm ∗ (f 1Kn ) − f 1Kn ||Lp (Ω) = ||ρm ∗ (f 1Kn ) −
f 1Kn ||p →m→∞ 0. Donc f 1Kn puis f sont dans l'adhérence de Cc∞ (Ω).
138
Annexe E
au chapitre 7
Le théorème des bases ne nécessite pas l'hypothèse I dénombrable ou H séparable, voici la version
générale.
Comme l'existence de base algébrique d'un espace vectoriel de dimension innie, elle requière un
lemme général de théorie des ensembles :
Lemme E.1. (de Zorn) Tout ensemble ordonné, inductif, non vide admet un élément maximal.
2 Théorème des bases dans le cas général
Théorème E.2. Soit H un espace préhilbertien.
1. Une famille orthonormale (x ) est libre et vérie l'inégalité de Bessel, pour tout x ∈ H :
i i∈I
X
|⟨x, xi ⟩|2 ≤ ||x||2
i∈I
139
2. De plus une famille orthonormale (e ) est une base hilbertienne si et seulement si on a
l'égalité de Bessel-Parseval :
i i∈I
X
|⟨x, xi ⟩|2 = ||x||2
i∈I
De plus, dans ce cas, pour tout x ∈ H , la série suivante converge (dans H mais pas absolument)
X
x= ei ⟨ei , x⟩.
i∈I
3. Si H est un espace de Hilbert, toute famille orthonormale peut être complétée en une base
hilbertienne de H et J : x 7→ (⟨x, e ⟩) établit alors une isométrie surjective J : H ≃ ℓ (I).
i i∈I
2
Remarque . E.1 De la formule pour x, on tire par continuité la formule pour le produit scalaire (qui
est série absolument convergente par Cauchy-Schwarz) :
X
⟨y, x⟩ = ⟨y, ei ⟩⟨ei , x⟩.
i∈I
Démonstration. (1) Si
P P
λi xi = 0, on calcule λj = ⟨xj , λi xi ⟩ = 0 donc xi est bien libre. Si F
est une partie nie de I , et V = VF = V ect(ei , i ∈ F ), on a déjà vu la formule pour la projection
orthogonale sur VF :
X
pV (x) = ei ⟨ei , x⟩.
i∈F
la famille est donc sommable et on a l'inégalité de Bessel pour la somme (en passant au supremum)
2
et on trouve en particulier (⟨x, ei ⟩)i∈I ∈ ℓ (I).
(2) Si (ei )i∈I est une base soit xn ∈ V ect(ei , i ∈ I) convergeant vers x.
De plus, pour n assez grand |||x||2 − ||xn ||2 | ≤ ϵ/2 et pour tout J ,
|||pVJ (x)||2 − ||pVJ (xn )||2 | ≤ ||pVJ (xn − x)||(||xn || + ||x||) ≤ ||(xn − x)||(||xn || + ||x||) ≤ ϵ/2
X
|⟨ej , x⟩|2 − ||x||2 ≤ ϵ
i∈J
X
|⟨ej , x⟩|2 = ||pVJn (x)||2 → ||x||2
j∈Jn
140
donc tout élément de H est limite d'éléments de V ect(ei , i ∈ I) d'où la propriété de base hilbertienne.
De plus un calcul donne la formule pour x :
X X
||x − ei ⟨ei , x⟩||2 = |⟨ei , x⟩|2 → 0.
i∈F i̸∈F
(3) Considérons l'ensemble des familles orthonormales contenant une famille orthonormale don-
née, et ordonné par inclusion. C'est un ensemble non-vide. Si on a une famille totalement ordonnée
de familles orthonormales, l'union est un majorant, donc l'ensemble ordonné est inductif, il admet
donc par le lemme de Zorn un élément maximal (ei )i∈I . Si ce n'était pas une base (complétant la
famille orthonormale de départ), on aurait un x avec
X
|⟨x, ei ⟩|2 < ||x||2 .
i∈I
2
P P
Comme H est complet la somme y = i∈I e i ⟨e i , x⟩ converge car si (In ) croissante telle que i∈In |⟨ei , x⟩| →
2
P P
i∈I |⟨ei , x⟩| la suite yn = i∈In ei ⟨ei , x⟩ est de Cauchy car pour q > p
X X
||yp − yq ||22 = |⟨ei , x⟩|2 ≤ |⟨ei , x⟩|2 → 0.
i∈Iq −Ip i̸∈Ip
On déduit que y − x est orthogonal à tout ei car tout i tel que ⟨ei , x⟩ ̸= 0 est dans un In et que
⟨yn − x, ei ⟩ = 0 pourn assez grand pour un tel i. Donc par orthogonalité
X
||y − x||22 = ||x||2 − |⟨x, xi ⟩|2 > 0
i∈I
n−1
√ X
n!Hn (x) = xn + ak x k .
k=0
141
2 /2 2 /2
En eet H1 (x) = (−1)ex (−xe−x )=x et si on suppose l'hypothèse au rang n
√
p 2 d 2 /2
(n + 1)!Hn+1 (x) = −ex /2 (e−x n!Hn (x))
dx
2 /2 2 /2 2 /2
d
(e−x xk ) = −xk+1 e−x + kxk−1 e−x
Or donc l'hyp de rec donne
dx
n−1 n−1
p 2 d 2 /2
X X
(n + 1)!Hn+1 (x) = −ex /2 (e−x (xn + ak xk )) = (xn+1 −nxn−1 )+ ak (xk+1 −kxk−1 )
dx k=0 k=0
Z m
1 d 2 /2
⟨Hn , Hm ⟩ = (−1) √ √ m
Hn (x) (e−x )dx
2π m! dx
Z m m−1 Z m−1
d −x2 /2 d −x2 /2 d 2 /2
Hn (x) (e )dx = [Hn (x) (e )]∞
−∞ − Hn′ (x) (e−x )dx
dx dx dx
2 /2
le crochet est 0 vu que P (x)e−x pour P polynome tend vers 0 en ±∞.
Par induction si m>n
Z m−n+1
1 d 2 /2
⟨Hn , Hm ⟩ = (−1) m−n
√ √ Hn(n+1) (x) (e−x )dx = 0
2π m! dx
(n)
√
et si m= n vu Hn (x) = n! en appliquant le 1.
Z m−n Z
1 d −x2 /2 1 2 /2
⟨Hn , Hn ⟩ = (−1) m−n
√ √ Hn(n) (x) (e )dx = √ e−x dx = 1
2π m! dx 2π
comme voulue.
142
Lemme E.3. Soit X ∼ N (m, σ ) de loi normale alors Φ
2
X (t)
2 2
= exp(− t 2σ + imt).
Proof : On a vu une preuve à l'exercice 8 du TD 3 de MASS 31 utilisant que la partie imaginaire est
nulle par parité et le calcul de la partie réelle en établissant une équation diérentielle par intégration
dépendant d'un paramètre.
On donne ici une autre preuve par prolongement analytique. Par transfert, on doit montrer
(x−m)2 2 2
√1 eixt− 2σ2 = exp(− t 2σ + imt) en faisant le changement de variables u = (x − m)/σ
R
on se
σ 2π
ramène au cas σ = 1, m = 0.
En prenant m = z dans le calcul de la densité, on a pour z ∈ IR
Z ∞ Z ∞
1 − x2 +z2 −2xz 1 (x−z)2
dx √ e 2 = dx √ e− 2 = 1.
−∞ 2π −∞ 2π
Pour z ∈ C,
l en appliquant le résultat précédent
∞ Z N
1 |zx|n − x2 1 X |zx|n − x2 |z|2
Z Z
X 1 x2
dx √ e 2 = lim dx √ e 2 ≤ dx √ e− 2 +|zx| ≤ exp( )<∞
n=0 IR 2π n! N →∞ IR 2π n=0 n! IR 2π 2
La première bornitude permet d'appliquer le TCD pour les séries (ou Fubini pour la mesure discrète)
et intervertir somme et série :
∞
1 xn − x 2
Z Z
X 1 x2
z n
dx √ e 2 = dx √ e− 2 +zx
n=0 IR 2π n! IR 2π
2
la fonction de droite est donc la somme d'une série entière exp( z2 ) pour z ∈ IR, donc par identication
des coecients, elle vaut cette valeur pour tout z ∈ C,
l en particulier pour z = it et on trouve le
résultat.
On démontrera le théorème suivant dans la prochaine section puisque la preuve utilise des pro-
priétés générales de l'indépendance importante à noter pour elles-mêmes :
Théorème E.4 (Théorème d'injectivité de la transformation de Fourier). Deux v.a. (X1 , ..., Xn ), (Y1 , ..., Yn )
tels que
Φ (X1 ,...,Xn ) (t) = Φ(Y1 ,...,Yn ) (t)∀t ∈ IR n
Z
1
f(X1 ,...,Xn ) (x) =
(2π)n IR n
Φ(X1 ,...,Xn ) (t)exp(−i⟨x, t⟩)dt.
143
Dénition E.2 (Convolution). µ une mesure de Proba sur S ⊂ IRd et f : IR → IR une fonction
Soit
mesurable telle que pour tout x ∈ S , y 7→ f (x − y) est dans L1 (IRd , µ), la convolution de f et µ est
la fonction f ∗µ dénie par : Z
(f ∗ µ)(x) = d
f (x − y)dµ(y).
IR
Si µ est absolument continue par rapport à la mesure de Lebesgue de densité g, on note aussi f ∗ g.
Proposition E.5. Soient X, Y : Ω → IR des v.a. indépendantes :
d
3. Si P (dx) = f (x)dx, P (dx) = g(y)dy alors P est absolument continue par rapport à
i i i i j j i j i j
4. Si seulement X est de loi absolument continue mais de densité continue bornée f , alors quel
que soit Y, P est absolument continue par rapport à Lebesgue (sur IR ) de densité f ∗ P d
Proof : 1. On a ΦX+Y (t) = E[eit(X+Y ) ] = E[eitX eitY ] = E[eitX ]E[eitY ] = ΦX (t)ΦY (t) l'avant dernière
itx
égalité par indépendance car f (x) = e est bornée donc intégrable (par rapport à une probabilité).
2. En général par bilinéarité Cov(Xi + Yi , Xj + Yj ) = Cov(Xi , Xj ) + Cov(Yi , Yj ) + Cov(Yi , Xj ) +
Cov(Yi , Xj ), mais ici par indépendance les deux derniers termes sont nuls.
3.Il faut d'abord vérier que f ∗ g est bien dénie. Par Fubini-Tonelli vu le caractère positif :
Z Z Z Z Z
n
dx n
dyf (x − y)g(y) = n
dy( n dxf (x − y))g(y) = n
dyg(y) = 1
IR IR IR IR IR
R
donc
IR
dyf (x − y)g(y) existe et est ni p.p.
n
ce qui donne le calcul de densité (égalité de la loi avec seulement le cas h = 1B ). Dans le cas de 4.
on raisonne pareil sauf que f x →
7 f (x −
continue bornée donne
R y) intégrable par rapport à la proba
PY directement. L'application de Fubini vient de IR2d |h(z)f (z − y)|dzPY (dy) ≤ ||h||∞ . L'égalité
R
intermédiaire donne aussi E(h(X + Y )) = d (h ∗ f )(y)PY (dy) = E((h ∗ f )(Y )) par transfert.
IR
Lemme E.6. Soit g la densité sur IR d'un n-uplet de variable gaussienne i.i.d. N (0, σ ). Pour
n 2
tout compact.
σ σ→0
144
En terme de convergence en loi, cela signiera au chapitre 2 que si (X1 (σ), ..., Xn (σ)) sont les
variables de densités gσ , alors x + (X1 (σ), ..., Xn (σ)) →σ→0 x en loi en utilisant la proposition E.5.(4)
au cas Y = x.
Proof : Par transfert et changement de variables
Z
(h ∗ gσ )(x) − h(x) = d
(h(x − σz) − h(x))g1 (z)dz.
IR
la limite vient de la convergence dominée par une constante 2||h||∞ puisque une constante est inté-
grable par rapport à une probabilité comme g1 (z)dz , et la limite ponctuelle en z vient de la continuité
de h qui est donc uniformément continue sur K + B(0, |z|) et donc pour |σ| < 1, x − σz, x sont dans
d
ce compact de distance σ|z| tendant vers 0. Si h est uniformément continue sur IR on a même
d
convergence uniforme sur IR .
On a aussi besoin de la conséquence suivante du lemme de classe monotone :
Proposition E.7. Soient X, Y : Ω → IR des variables aléatoires. Les propriétés suivantes sont
n
équivalentes
1. X, Y sont égales en loi : P = P . R
2. Pour tout h : IR → IR, continue bornée, h(X)dP = R h(Y )dP
X Y
n
Preuve du Thm E.4 : Pour montrer l'injectivité, par le lemme E.7, il sut de montrer que l'égalité
des transformée de Fourier implique égalité de E(h(X)) pour tout h continue bornée.
145
Or par le lemme précédent, (h ∗ gσ )(x) → h(x) tout en étant borné par ||h||∞ donc par TCD :
la dernière égalité avec Yσ de densité gσ et indépendant de X par la proposition E.5 (4) puisque la
densité gσ est continue bornée. Or la transformée de Fourier de X + Yσ est ΦX+Yσ (t) = ΦX (t)ΦYσ (t)
par la proposition E.5 (2) et donc
||t||22 σ 2
ΦX+Yσ (t) = ΦX (t)exp(− )
2
par le calcul du lemme E.3. Comme ceci est intégrable, on s'attend à avoir la formule d'inversion de
Fourier de la deuxième partie qui va donner E(h(X + Yσ )) en fonction de ΦX+Yσ (t), nous allons donc
la montrer à la main dans ce cas pour conclure la preuve.
Or en interprétant la densité comme une variante de la transformée de Fourier dans le cas gaus-
sien :
146
Dénition E.3. Si µ, ν sont des mesures de probabilités sur (Ω, T ), on dit que µ est absolument
continue par rapport à ν et on note µ≪ν si pour tout A ∈ T , ν(A) = 0 implique que µ(A) = 0
Dénition E.4. Si sont des mesures de probabilités sur (Ω, T ), on dit que µ admet une densité
µ, ν
1 dµ
h ∈ L (Ω, ν) par rapport à ν et on note h =
dν
, si h ≥ 0 p.s. et pour tout A ∈ T :
Z
1A hdν = µ(A).
Ω
Les dénitions s'étendent aux mesures σ -nies, mais on considère seulement ici le cas de proba-
bilités.
R
Proof : Si on a deux densités
R − k)dν = 0 pour tout A T mesurable, donc par la
Rh, k , Ω 1A (h
construction de l'intégrale aussi
Ω
f hdν = Ω f kdν d'abord pour f mesurable positive (par TCM)
1
puis pour f mesurable bornée donc par dualité h − k = 0 dans L (Ω, ν) donc ν -p.s.
R R
De plus, si on a existence d'une densité et si ν(A) = 0, par TCM, 1A h = limn→∞ 1 (h∧n) = 0
R Ω Ω A
1/2
car | 1 (h ∧ n)dν| ≤ ||(h ∧ n)∥|2 ||1A ||2 ≤ nν(A) = 0 par Cauchy-Schwartz. Donc µ(A) = 0 c'est
Ω A
à dire on a montré µ ≪ ν .
La partie dicile est l'existence d'une densité si µ ≪ ν . On va utiliser le théorème de représenta-
1
tion de Riesz (ou sa variante pour la dualité de L , le théorème D.8). Soit µα = µ + αν avec α > 0.
dµα dν 1
L'idée est simple on s'attend à avoir une densité
dν
= α + h strictement positive et donc dµ α
= α+h
2 α h
bornée par 1/α donc dans L ensuite α(1 − ) = α α+h →α→∞ h et on devrait pouvoir retrouver
α+h
h ainsi.
1
Appliquons cette idée, si f ∈ L (Ω, dµα ), on a
Z Z Z
1 1
|f |dν = |f |dαν ≤ |f |dµα
α α
1
R
Donc f ∈ L (Ω, dν) et f 7→ f dν dénit une forme linéaire continue sur L1 (Ω, dµα ), donc par le
∞ 1
théorème D.8, il existe hα ∈ L (Ω, dµα ) telle que pour tout f ∈ L (Ω, dµα ) on a
Z Z
f dν = f hα dµα .
R
Et de plus, on a ||hα ||L∞ (µα ) ≤ 1/α. Si f = 1{hα <0} , on obtient max(0, hα )dµα ≥ 0 donc vaut 0,
donc
1
ν({hα < 0}) ≤ µα ({hα < 0}) = 0
α
donc hα ≥ 0, ν p.s.
1
On montre maintenant la monotonie attendue pour hα (si on veut qu'elle soit égale à un
α+h
) Si
β > α, on a pour f positive bornée en utilisant µα (g) ≤ µβ (g) pour g positive ν -p.s,
Z Z Z Z
f hβ dµβ = f dν = f hα dµα ≤ f hα dµβ
carf hα posivite ν -p.s. par le résultat précédent, donc comme c'est valable pour tout f ≥ 0, on a
hβ ≤ hα µβ -p.s. donc ν -p.s.
147
Finalement, on a l'identité
Z Z Z Z Z Z
f dµ = f dµα − f αdν = f (1 − αhα )dµα = f α(1 − αhα )dν + f (1 − αhα )dµ.
Par ||hα ||L∞ (µα ) ≤ 1/α. on a 1 − αhα ≥ 0 µα -p.s. donc ν -p.s. En raisonnant comme avant on
obtient (1 − αhα ) ≥ (1 − βhβ ) ν -p.s. Donc, par l'égalité précédente (toujours pour f positive en
utilisant la croissance de α → αhα ν -p.s. par ce qu'on vient de voir donc µ-p.s. par l'hypothèse
µ ≪ ν) : Z Z Z Z
f α(1 − αhα )dν = f αhα dµ ≤ f βhβ dµ = f β(1 − βhβ )dν
soit α(1−αhα ) ≤ β(1−βhβ ), ν -p.s. donc converge vers un h en croissant et par convergence monotone
et l'égalité avant on obtient
Z Z Z Z Z
f hdν = lim f α(1 − αhα )dν = lim f dµ − f (1 − αhα )dµ ≤ f dµ.
α→∞ α→∞
α(1 − αhα ) h
(1 − αhα ) = ≤ →α→∞ 0
α α
ν -p.s. puisque h est ni ν -p.s. donc en utilisant encore l'hypothèse, aussi
R µ-p.s. Comme on a vu
la monotonie en α par convergence monotone, on déduit f (1 − αhα )dµ → 0 et donc nalement
l'égalité attendue qui conclut la preuve :
Z Z Z Z
f hdν = lim f dµ − f (1 − αhα )dµ = f dµ.
α→∞
Théorème E.9 Soit une suite (X ) dans L (Ω, T , P ) avec T une tribu dénom-
. 1
l'équivalence entre
1. (X ) est uniformément intégrable
2. (X ) admet une sous-suite (X ) ayant pour limite faible X ∈ L , c'est-à-dire :
n
1
n nk
3. (X ) est bornée dans L et pour tout ϵ > 0, il existe η > 0 tel que si A ∈ T vérie P (A) ≤ η
1
Proba-
C'est surtout l'équivalence entre 1. et 2. qui est dicile et porte le nom de théorème de Dunford-
bilités et Potentiel
Pettis. L'hypothèse dénombrablement engendrée" n'est pas nécessaire (cf. Delacherie-Meyer
Vol 1 p 27) mais nous la faisons pour simplier.
Proof : On commence par l'équivalence entre 1 et 3. Supposons 3. et xons ϵ > 0, η t.q. P (A) ≤ η
sup E(|Xn |)
n∈IN
implique E(1A |Xn |) ≤ ϵ. Par l'inégalité de Markov P (|Xn | ≥ c) ≤ c
≤ η dès que
sup E(|Xn |)
n∈IN
c≥ η
, en appliquant alors à A = {|Xn | ≥ c}, on déduit supn E(1{ |Xn | ≥ c}|Xn |) ≤ ϵ. Et
donc limc→∞ E(1{ |Xn | ≥ c}|Xn |) = 0 qui est l'uniforme intégrabilité recherchée.
148
Réciproquement, pour ϵ < 0 xé, on prend c > 0 tel que supn E(1{|Xn |≥c} |Xn |) ≤ ϵ/2, (en
particulier
E(|Xn |) = E(1{|Xn |≥c} |Xn |) + E(1{|Xn |<c} |Xn |) ≤ c + ϵ/2
donc Xn et bornée dans L1 , de sorte que
E(1A |Xn |) = E(1A 1{|Xn |≥c} |Xn |)+E(1A 1{|Xn |<c} |Xn |) ≤ E(1{|Xn |≥c} |Xn |)+E(1A 1{|Xn |<c} c) ≤ ϵ/2+P (A)c
On a donc obtenu 2.
On laisse en exercice l'implication de 3. vers 1. que l'on n'a pas utilisé dans le cours.
149