Uploaded by lucillien0769

Cours Algèbre - Analyse

advertisement
UE MAT234
Notes de cours sur les fonctions de plusieurs variables
1
1.1
1.1.1
Fonctions de plusieurs variables réelles
L’espace Rn , définition et géométrie.
Distance sur Rn .
Dans ce cours, nous allons considérer des fonctions dépendant de plusieurs variables :
mathématiquement, ceci veut dire que ce sont des fonctions définies sur (une partie de)
l’espace Rn . Nous commençons donc par quelques éléments sur cet espace.
Définition 1 Un élément de l’espace Rn est un n-uplet (x1 , . . . , xn ) ou chaque xi est un
numbre réel.
Noter que dans ce cours, un élément de Rn est un vecteur ligne. Ceci est une convention qui
permet de simplifier la notation, mais qui n’est pas universelle, certains auteurs préférant
écrire les éléments de Rn comme des vecteurs colonnes.
Les valeurs numériques xi s’appellent les coordonnées cartesiennes du point (x1 , . . . , xn ).
Nous verrons plus loin d’autres systèmes de valeurs numériques qui peuvent être utilisés
pour caractériser un point dans Rn .
Le produit scalaire (euclidien) sur R3 est donné par
(x1 , x2 , x3 ) · (y1 , y2 , y3 ) = x1 y1 + x2 y2 + x3 y3 .
Cette structure se généralise aussi à Rn :
Définition 2 Soient v = (x1 , . . . , xn ) et w = (y1 , . . . , yn ) des vecteurs de Rn . On pose alors
v · w = x1 y1 + . . . + xn yn .
On se rappelle que le théorème de Pythagore nous permet de calculer la distance entre deux
vecteurs de R2 ou R3 . Par exemple, si w1 = (x1 , y1 , z1 ) et w2 = (x2 , y2 , z2 ) sont deux points
dans R3 , alors la distance entre w1 et w2 est donnée par
p
d(w1 , w2 ) = (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 ,
et la longueur d’un vecteur w = (x, y, z) dans R3 est donnée par
p
kwk = x2 + y 2 + z 2 .
La forme de ces deux expressions suggère naturellement la définition suivante.
1
Définition 3 Soient v1 = (x1 , . . . xn ) et v2 = (y1 , . . . , yn ) deux points dans Rn . Alors la
distance (euclidienne) entre v1 et v2 est définie par
p
d(v1 , v2 ) = (x1 − y1 )2 + . . . + (xn − yn )2 .
La norme (euclidienne) ou la longueur d’un vecteur v = (x1 , . . . , xn ) ∈ Rn est donée par
q
kvk = x21 + . . . + x2n .
La norme de Rn s’écrit simplement en termes du produit scalaire :
√
kvk = v · v,
et
d(v1 , v2 ) = kv1 − v2 k =
p
(v1 − v2 ) · (v1 − v2 )
Par ailleurs, on a
v · w = kvkkwk cos θ
ou θ est l’angle entre v et w.
Définissons enfin le produit vectoriel :
Définition 4 Soient v = (x1 , x2 , x3 ) et w = (y1 , y2 , y3 ) des vecteurs de R3 . On définit le
produit vectoriel v ∧ w par
v ∧ w = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ) .
Le produit vectoriel a les propriétés suivantes.
1. v ∧ w = −w ∧ v et en particulier v ∧ v = 0
2. (v ∧ w) · v = (v ∧ w) · w = 0.
3. kv ∧ wk = kvkkwk | sin θ|
ou θ est l’angle entre v et w.
1.1.2
Systèmes alternatifs de coordonnées sur Rn .
Dans certaines applications, notamment en R2 et R3 , il peut être utile de caractériser
les points de l’espace par d’autes systèmes de coordonnées. Commençons par préciser ce que
veut dire un système de coordonnées.
Définition 5 Soit D ⊂ Rn un domaine dans Rn . Un système de coordonnées sur D est une
bijection
Φ : D → D0
donné par
Φ : (x1 , . . . , xn ) → (y1 , . . . , yn )
l’ensemble D0 étant un domaine de Rn .
2
Intuitivement, si P = (x1 , . . . , xn ) est un point de D alors les nombres (y1 , . . . , yn ) = Φ(P )
donnent un étiquettage alternatif de P .
Nous passons maintenant en revue les trois systèmes de coordonnées alternatifs les plus
utilisés.
Coordonnées polaires.
C’est un système de coordonnées sur R2 \ {0}. On identifie le vecteur v = (x, y) avec les
données (r, θ) ou
— r > 0 est le rayon c’est à dire, la distance entre v et l’origine 1
— θ est l’angle entre v et l’axe des x dans le sens trigonométrique.
L’angle θ ∈ [0, 2π[ est uniquement caractérisé par les équations x = r cos θ, y = r sin θ.
Nous appelons le couple (r, θ) les coordonnées polaires du point (x, y). Ce changement de
coordonnées
(x, y) −→ (r, θ)
est bijectif de IR2 /{(0, 0)} vers IR∗+ × [0, 2π[.
Le changement inverse est :
p
1. r = x2 + y 2
2. θ est l’unique angle tel que cos θ = p
x
x2
+
y2
et sin θ = p
y
x2
+ y2
.
Coordonnées cylindriques.
Un point M (x, y, z) de IR3 peut aussi être repéré par ses coordonnées cylindriques
(r, θ, z). Dans ce trio, la coordonné z ne change pas, mais les coordonnées (x, y) et y sont
remplacés par les coordonnées polaires définies par
x = r cos θ,
y = r sin θ,
avec r > 0 et θ ∈ [0, 2π[.
Coordonnées sphériques.
Un point M (x, y, z) de IR3 peut aussi être repéré par ses coordonnées sphériques (r, θ, ϕ),
définies par
x = r cos ϕ sin θ,
y = r sin ϕ sin θ,
z = r cos θ,
avec r
1.
2.
3.
> 0, θ ∈]0, π[ et ϕ ∈ [0, 2π[. C’est un système de repérage usuel sur une sphère.
r est appelé rayon ou distance au centre,
ϕ longitude,
θ colatitude (π/2 − ϕ est la latitude).
1. Par le théorème de Pythagore, on a donc r =
p
x2 + y 2 .
3
1.2
Définition des fonctions de plusieurs variables.
Vous avez déjà étudié en MAT203 les fonctions d’une seule variable, c’est à dire, des
règles mathématiques qui associent à un nombre réel 2 x un autre nombre réel f (x). Or, la
plupart des quantités rencontrées en physique ne dépendent pas d’une seule, mais de plusieurs
variables. Par exemple, la pression ou la temperature peuvent varier avec trois variables de
l’espace (x, y, z) et avec le temps t. Ils sont donc répresentés par des fonctions
P (x, y, z, t) = pression au point (x, y, z) en un temps t
et
T (x, y, z, t) = température au point (x, y, z) en un temps t.
De même, l’énérgie d’un particule qui évolue sous l’effet d’un potentiel dépendra non seulement de la position du particule, mais aussi de sa vitesse. On la répresente donc par une
fonction de six variables (trois variables de position du particule, et trois variables de vitesse).
Il convient donc d’essayer de généraliser l’étude des fonctions d’une seule variable à des
fonctions pouvant dépendre de plusieurs variables.
Définition 6 Une fonction réelle de n variables, f , est une fonction définie sur un sousensemble Df ⊂ Rn et qui à chaque vecteur x ∈ Df associe une valeur numérique f (x).
f : Df ⊂ IRn −→ IR
(x1 , . . . , xn ) −→ f (x1 , . . . , xn )
La région Df ou la fonction f est définie s’appelle le domaine de définition de la fonction.
On travaillera souvent avec n = 2 ou n = 3. On utilisera parfois dans ce cas la notation
(x, y) ou (x, y, z) plutôt que (x1 , x2 ) ou (x1 , x2 , x3 ).
Exemples
v
u n
uX
x2i
— Longueur (ou norme) d’un vecteur : f (x1 , . . . , xn ) = t
i=1
— Température en un point : c’est une fonction de la position (x, y, z) et du temps t :
T (x, y, z, t)
Le but de la première partie de ce cours sera de tenter de généraliser aux fonctions de
plusieurs variables les propriétés et opérations de base - continuité, dérivation, integration
- que vous connaissez déjà pour les fonctions d’une seule variable. Le cas de la continuité
est simple, puisque la définition donnée dans le cadre des fonctions d’une seule variable se
généralise sans difficulté.
Définition 7 Soit f : Df ⊂ IRn −→ IR une fonction de plusieurs variables. On dit que f
est continue en a = (a1 , . . . , an ) si et seulement si pour chaque suite xi telle que xi → a
nous avons que f (xi ) → f (a).
Ici, on considère que xi → a si et seulement si d(xi , a) → 0.
2. Qui doit parfois satisfaire à certaines conditions : par exemple,
de x positives ou nulles.
4
√
x n’est définie que pour des valeurs
1.2.1
Généralisation : fonctions de IRn vers IRp
On peut généraliser de façon naturelle les fonctions de IRn vers IR et introduire des
fonctions de IRn vers IRp pour p > 1 :
f : Df ⊂ IRn −→ IRp
(x1 , . . . , xn ) −→ (f1 (x1 , . . . , xn ), . . . , fp (x1 , . . . , xn ))
où chaque fonction fi est une fonction de IRn vers IR.
Exemple : Considèrons une fluide en mouvement dans un domaine D ∈ R3 . On peut
assigner à chaque point x ∈ D le vecteur vélocité instantanée v(x) de l’élément de fluide se
trouvant au point x au temps t = 0. Ceci est une fonction
v : D → R3 .
1.2.2
Répresentations graphiques des fonctions de deux variables réelles
On considère ici f de IR2 vers IR.
Représentation 3-D : on trace en perspective dans IR3 la surface formée des points
(x, y, f (x, y)).
Représentation par lignes de niveaux : on trace dans le plan les lignes de niveau de la
fonction. L’isoligne de niveau ` est {(x, y) : f (x, y) = `}
2
2
Exemple : La ligne
√ de niveau ` (` ≥ 0) de la fonction f (x, y) = x + y est le cercle de
centre 0 de rayon `.
2
Dérivation d’une fonction de plusieurs variables
2.1
Dérivées premières
Soit f de IRn vers IR, (e1 , . . . , en ) la base canonique de IRn , et a ∈ IRn .
Définition Soit d un vecteur de IRn . On appelle dérivée directionnelle de f au point
∂f
(a) :
a dans la direction d, notée
∂d
∂f
f (a + αd) − f (a)
f (a1 + αd1 , . . . , an + αdn ) − f (a1 , . . . , an )
(a) = lim
= lim
α→0
α→0
∂d
α
α
La dérivée directionnelle ∂f /∂d est donc une fonction de IRn vers IR.
5
si elle existe
Exemples :
— La pente d’un relief dans une direction donnée est la dérivée directionnelle dans cette
direction.
√
3
1
— Soit f (x, y) = x3 y − y et d = ( ,
). On a :
2 2
√
3 2
∂f
3 3
(x, y) = x y +
(x − 1).
∂d
2
2
— En physique, on parle souvent de dérivée normale et de dérivée tangentielle pour
désigner la dérivée directionnelle en un point d’une courbe ou d’une surface donnée,
dans la direction normale ou tangente à cette courbe ou surface.
Définition On appelle dérivée partielle de f par rapport à la i-ème variable xi la dérivée
∂f
directionnelle de f dans la direction ei . Elle est notée
.
∂xi
En pratique on calcule ∂f /∂xi comme une dérivée classique, en supposant les variables
x1 ,. . .,xi−1 ,xi+1 ,. . .,xn constantes et en dérivant par rapport à xi .
Définition Le vecteur
∂f
∂f
(a), . . . ,
(a) est appelé gradient de f au point a, noté
∂x1
∂xn
gradf (a) ou ∇f (a).
Définitions On dit que f est de classe C 1 en a si chaque dérivée partielle existe au
voisinage de a et est continue en a.
Propriété Si f est C 1 en a alors pour tout vecteur direction d nous avons que
∂f
(a) = ∇f (a) · d
∂d
Définition On suppose que f est de classe C 1 en a. On appelle différentielle de f en a
l’application linéaire notée Df [a] définie par
Df [a] : IRn −→ IR
h = (h1 , . . . , hn ) −→ Df [a](h) =
n
X
∂f
∂xi
i=1
(a) hi = ∇f (a)·h
On utilise souvent la notation dxi pour répresenter l’application linéaire
dxi : (x1 , . . . , xn ) → xi .
La différentielle f en a s’écrit alors
n
X
∂f
Df [a] =
dxi .
∂xi
i=1
Notons que
∂f
(a) = Df [a](h).
∂h
6
Propriété On a que f (a + h) = f (a) + Df [a](h) + o(khk).
C’est l’équivalent de la formule des accroissements finis pour les fonctions d’une seule
variable.
La differentielle d’une fonction f définie sur un domain Df nous donne pour chaque point
a ∈ Df une application linéaire Df [a] : Rn → R. La notion de forme differentielle généralise
cette idée.
Définition. Soit D un domaine de Rn . Une forme différentielle ω sur D est une fonction
qui associe à chaque point de a ∈ D une application linéaire
ω[a] : Rn → R.
Une forme differentielle ω s’écrit sous la forme
ω = g1 dx1 + g2 dx2 + . . . + gn dxn ,
et on a alors
ω[a](h) =
n
X
gi (a)hi .
i=1
La différentielle d’une fonction f est la forme différentielle particulière :
X ∂f
dxi .
Df [a] =
∂xi
i
On dit dans ce cas que la forme différentielle est exacte.
Définition Soit f de IRn vers IRp : f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fp (x1 , . . . , xn )).
f est de classe C 1 en a ∈ IRn si et seulement si chaque application composante fi l’est.
La différentielle de f en a ∈ IRn s’écrit alors :
Df [a](h) = (Df1 [a](h), . . . , Dfp [a](h)), soit en abrégé Df [a] = (Df1 [a], . . . , Dfp [a]).
Ainsi, puisque Dfi [a](h) = ∇fi ·h, on a, avec des notations en vecteurs colonnes :


∂f1
∂f1




[a]
·
·
·
[a]

 ∂x1
h
Df1 [a](h)
1
∂x
n
 . 

 
..
..
..
..

  ..  ,
Df [a](h) = 
=

.
.
.
.


 h
 ∂fp
∂fp
Dfp [a](h)
n
[a] · · ·
[a]
∂x1
∂xn
Définition
Soit f : Rn → Rp une fonction C 1 , définie au point a. On appelle matrice
jacobienne de f au point a la matrice


∂f1
∂f1
 ∂x1 [a] · · · ∂xn [a] 


..
..
..

Jf (a) = 
.
.
.


 ∂fp

∂fp
[a] · · ·
[a]
∂x1
∂xn
Nous avons en particulier que pour tout a ∈ Df et tout h, notation en vecteurs colonnes :
Df [a](h) = Jf (a)h.
7
Exemple On reprend l’exemple du changement de variables en coordonnées polaires x =
r cos θ, y = r sin θ. L’application des résultats précédents donne
dx
cos θ −r sin θ
dr
=
dy
sin θ
r cos θ
dθ
2.2
Dérivation de fonctions composées
Propriété Soit f : E1 ⊂ IRn → IRp et g : E2 ⊂ IRp → IR. On suppose, pour que g ◦ f soit
définie, que f (E1 ) ⊂ E2 . Soit a ∈ E1 . On suppose que f est différentiable en a et que g est
différentiable en f (a). Alors g ◦ f est différentiable en a et
D(g ◦ f )[a] = Dg[f (a)] ◦ Df [a].
En écriture matricielle, ceci est équivalent à
Jg◦f (a) = Jg (f (a)) Jf (a)
Application au changement de variables Soit Φ un changement de coordonnées (x1 , . . . , xn ) →
(y1 , . . . , yn ). Soit f une fonction de classe C 1 et g = f ◦ Φ : g(x1 , . . . , xn ) = f (y1 , . . . , yn ). La
propriété précédente s’écrit
n
∀i = 1, . . . , n
X ∂f
∂yk
∂g
(x1 , . . . , xn ) =
(y1 , . . . , yn )
∂xi
∂yk
∂xi
k=1
Cette formule est parfois appelée formule des dérivées totales.
Exemple Soit une fonction f de IR2 vers IR. On note g son expression en coordonnées
polaires g(r, θ) = f (r cos θ, r sin θ) = f (x, y). On a alors :

y
∂f
∂f

 ∂g = ∂f ∂x + ∂f ∂y = cos θ ∂f + sin θ ∂f = p x
+p


∂x ∂r
∂y ∂r
∂x
∂y
 ∂r
x2 + y 2 ∂x
x2 + y 2 ∂y


∂g
∂f ∂x ∂f ∂y
∂f
∂f
∂f
∂f


=
+
= −r sin θ
+ r cos θ
= −y
+x

∂θ
∂x ∂θ
∂y ∂θ
∂x
∂y
∂x
∂y
qui s’inverse en

∂f
∂g 1
∂g


=
cos
θ
−
sin
θ

 ∂x
∂r r
∂θ


∂f
∂g 1
∂g


= sin θ
+ cos θ
∂y
∂r r
∂θ
2.3
Dérivées d’ordres supérieurs
Soit une fonction f de E ⊂ IRn vers IR.
8
Définition Soient {i1 , . . . , ik } ∈ {1, . . . , n}k . On dit que f admet une dérivée partielle
n
d’ordre k au pointa ∈ IR
xik si et seulement si
par rapport
aux variables
xi1, . . . ,
∂f
∂
∂f
∂
∂f
∂f
—
,
,...,
···
···
∂xi1 ∂xi2 ∂xi1
∂xik−1 ∂xik−2
∂xi1
existent
dans un
de a et
voisinage
∂f
∂f
∂
— ∂xi ∂xi · · · ∂xi · · · (a) existe
k
1
k−1
On note cette dérivée
∂kf
(a).
∂xik . . . ∂xi1
Définition On dit que f est de classe C k sur E si et seulement si toutes les dérivées
partielles de f jusqu’à l’ordre k existent et sont continues sur E.
Théorème de Schwarz Si f est de classe C 1 sur E, si
∂ 2f
∂ 2f
et
existent sur E
∂xi ∂xj
∂xj ∂xi
∂ 2f
∂ 2f
(a) =
(a).
∂xi ∂xj
∂xj ∂xi
On en déduit que, pour f de classe C k , l’ordre de dérivation dans le calcul des dérivées
partielles n’a pas d’importance.
et sont continues en a, alors
2.4
Formule de Taylor à l’ordre 2
Soit une fonction f de IRn vers IR, de classe C 2 . Soit a = (a1 , . . . , an ). On a alors pour
tout incrément h = (h1 , . . . , hn ) :
f (a + h) = f (a) +
n
X
i=1
n
hi
n
1 XX
∂f
∂ 2f
(a) +
hi hj
(a) + o(khk2 )
∂xi
2 i=1 i=1
∂xi ∂xj
Dans le cas d’une fonction de deux variables, cette formule devient :
f (x + h, y + k) = f (x, y) + h
+
∂f
∂f
(x, y) + k
(x, y)
∂x
∂y
h2 ∂ 2 f
∂ 2f
k2 ∂ 2f
(x,
y)
+
hk
(x,
y)
+
(x, y) + o(kh, kk2 )
2
2
2 ∂x
∂x∂y
2 ∂y
On peut aussi l’exprimer sous la forme suivante : il existe θ ∈]0, 1[ tel que
f (x + h, y + k) = f (x, y) + h
+
3
∂f
∂f
(x, y) + k
(x, y)
∂x
∂y
h2 ∂ 2 f
∂ 2f
k2 ∂ 2f
(x
+
θh,
y
+
θk)
+
hk
(x
+
θh,
y
+
θk)
+
(x + θh, y + θk)
2 ∂x2
∂x∂y
2 ∂y 2
Opérateurs aux dérivées partielles
Beaucoup de phénomènes physiques peuvent être traduits par des équations aux dérivées
partielles, dans lesquelles apparaissent quelques opérateurs usuels.
9
3.1
Opérateurs usuels
n
1
Gradient Soit une
fonction f de IR vers
IR de classe C . On a déjà défini le gradient
∂f
∂f
de f au point a :
(a), . . . ,
(a) , noté gradf (a) ou ∇f (a).
∂x1
∂xn
En tout point a ∈ IR2 , ∇f (a) est orthogonal à la ligne de niveau f (a).
Divergence Soit une fonction f de IRn vers IRn (on dit aussi “champ de vecteurs”) de
classe C 1 . On note f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fn (x1 , . . . , xn )). On appelle divergence de f la fonction de IRn vers IR définie par
div f =
∂fn
∂f1
+ ··· +
.
∂x1
∂xn
Cet opérateur caractérise la convergence ou la divergence ponctuelle d’un champ de vecteurs.
On note aussi div f = ∇·f
Laplacien Soit une fonction f de IRn vers IR de classe C 2 . On appelle laplacien de f la
fonction de IRn vers IR, notée ∆f ou ∇2 f , définie par
∆f =
∂ 2f
∂ 2f
+
·
·
·
+
∂x21
∂x2n
On a : ∆f = div (∇f ).
Les fonctions f vérifiant ∆f = 0 sont appelées fonctions harmoniques. Elles interviennent
notamment dans la résolution de l’équation des ondes et de l’équation de la chaleur (voir
plus loin).
On peut aussi étendre la définition du laplacien à des champs de vecteurs : soit f de IRn
vers IRp de classe C 2 : f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fp (x1 , . . . , xn )). On définit alors
∆f = (∆f1 , . . . , ∆fp ).
Rotationnel Soit f de IR3 vers IR3 de classe C 1 : f (x, y, z) = (f1 (x, y, z), f2 (x, y, z), f3 (x, y, z)).
On appelle rotationnel de f la fonction de IR3 vers IR3 , notée rot f et définie par :
∂f3 ∂f2 ∂f1 ∂f3 ∂f2 ∂f1
−
,
−
,
−
rot f =
∂y
∂z ∂z
∂x ∂x
∂y
Cette quantité caractérise le mouvement de rotation du champ de vecteurs f autour de
chaque axe. On note aussi : rot f = ∇ ∧ f
Par abus de langage, on parle aussi parfois du rotationnel d’un champ de vecteurs f de IR2
∂f2 ∂f1
vers IR2 , en le définissant comme la fonction de IR2 vers IR : rot f =
−
∂x
∂y
Equations aux dérivées partielles usuelles La plupart des phénomènes physiques
peuvent être décrits, tout au moins de façon simplifiée, par des équations aux dérivées
partielles (EDP) qui traduisent en général des principes tels que conservation de la masse,
de la chaleur, de la quantité de mouvement. . . Les opérateurs précédents interviennent très
souvent dans ces EDP. Par exemple :
10
∂f
(x, t) = div (ν(x) grad f ) (x, t) où f est la température et
∂t
∂f
ν la diffusivité thermique. Cette équation devient
(x, t) = ν ∆f (x, t) si ν est constante.
∂t
∂ 2f
• équation des ondes : 2 (x, t) = c2 ∆f (x, t) où c est la célérité des ondes.
∂t
• équation de la chaleur :
3.2
Quelques propriétés
Linéarité Gradient, divergence, laplacien et rotationnel sont des opérateurs linéaires.
On a donc T (f + g) = T (f ) + T (g) et T (λf ) = λT (f ), où T représente n’importe
lequel de ces opérateurs.
Composition d’opérateurs Pour les propriétés qui suivent, f et g sont des fonctions
de IRn vers IR, et u est un champs de vecteurs de IRn vers IRn . Ces fonctions seront
de classe C 1 ou C 2 suivant le contexte, et on supposera n = 3 lorsqu’on fera intervenir
le rotationnel. On a alors :
grad (f g) = f grad g + g grad f
div (f u) = f div u + grad f ·u
rot (f u) = f rot u − u ∧ grad f
div (rot u) = 0
rot (grad f ) = 0
rot (rot u) = grad (div u) − ∆u
Expressions en coordonnées polaires
On note (O, i, j) le repère orthonormé cartésien de IR2 . Pour un point M de coordonnées cartésiennes (x, y) et de coordonnées polaires (r, θ), on définit le vecteur
→
unitaire ur = cos θ i + sin θ j, c’est à dire OM = rur . Soit uθ le vecteur unitaire qui
lui est directement orthogonal : uθ = − sin θ i + cos θ j.
• Soit f de IR2 vers IR de classe C 1 . On note g son expression en coordonnées polaires :
f (x, y) = g(r, θ). On a alors :
∇f =
∂f
∂g
1 ∂g
∂f
i+
j=
ur +
uθ
∂x
∂y
∂r
r ∂θ
• Soit f de IR2 vers IR de classe C 2 . On note g son expression en coordonnées polaires :
f (x, y) = g(r, θ). On a alors :
∆f =
∂ 2f
∂ 2f
∂ 2 g 1 ∂g
1 ∂ 2g
+
=
+
+
∂x2
∂y 2
∂r2 r ∂r r2 ∂θ2
• Soit f un champ de vecteurs de IR2 vers IR2 de classe C 1 . On note
f (M ) = f1 (x, y) i + f2 (x, y) j = g1 (r, θ) ur + g2 (r, θ) uθ .
Alors :
div f =
∂g1 1
1 ∂g2
+ g1 +
∂r
r
r ∂θ
11
Expressions en coordonnées cylindriques
Les expressions du laplacien et de la divergence se déduisent des expressions en coordonnées polaires. Soit f de IR3 vers IR. On note g son expression en coordonnées
cylindriques : f (x, y, z) = g(r, θ, z). On a alors :
∇f =
∆f =
∂f
∂f
∂g
1 ∂g
∂g
∂f
i+
j+
k=
ur +
uθ + k
∂x
∂y
∂y
∂r
r ∂θ
∂z
∂ 2f
1 ∂ 2g ∂ 2g
∂ 2f
∂ 2f
∂ 2 g 1 ∂g
+
+
+
=
+
+
∂x2
∂y 2
∂z 2
∂r2 r ∂r r2 ∂θ2 ∂z 2
Soit maintenant f de IR3 vers IR3 de classe C 1 . On note (O, i, j, k) le repère orthonormé cartésien de IR3 . Pour un point M de coordonnées cartésiennes (x, y, z) et de
coordonnées cylindriques (r, θ, z), on note
f (M ) = f1 (x, y, z) i+f2 (x, y, z) j+f3 (x, y, z) k = g1 (r, θ, z) ur +g2 (r, θ, z) uθ +g3 (r, θ, z) k.
Alors :
1 ∂g2 ∂g3
∂g1 1
+ g1 +
+
div f =
∂r
r
r ∂θ
∂z
∂g2 1 ∂g3
∂g1 ∂g3
1 ∂(rg2 ) 1 ∂g1
rot f = −
+
−
−
ur +
uθ +
k
∂z
r ∂θ
∂z
∂r
r ∂r
r ∂θ
4
4.1
Intégrales multiples
Quelques propriétés
La notion de fonction intégrable pour les fonctions de plusieurs variables est une généralisation
directe de la même notion pour les fonctions d’une seule variable.
Pour Zf fonction de IRn vers IR intégrable, son intégrale
sur un domaine D est notée
Z
Z
. . . f (x1 , . . . , xn ) dx1 . . . dxn , ou encore en abrégé
f (x) dx.
D
D
Soient f et g des fonctions de IRn vers IR intégrables sur un domaine D de IRn . On a les
propriétés
Z suivantes Z:
Z
Z
Z
—
(f + g) =
f+
g
et
λf = λ f
∀λ ∈ IR
(linéarité)
D
D
D
D
ZD
Z
Z
— Si f ≥ 0 sur D alors
f ≥ 0. On en déduit que, si f ≥ g sur D, alors
f≥
g.
D
D
D
Z
Z
— Si f est intégrable sur D alors |f | l’est aussi, et
|f | ≥
f .
D
Z D
— Si f ≥ 0 sur D, si f est continue sur D, et si
f = 0, alors f = 0 sur D.
D
Z
2 Z
Z
2
2
—
fg ≤
f
g
(Inégalité de Schwarz)
D
D
D
Z
Z
Z
On a aussi la relation de Chasles :
f=
f+
f pour des domaines D1 et D2
D1 ∪D2
D1
D2
dont l’intersection est de mesure nulle (c’est à dire de surface nulle en dimension 2, ou de
volume nul en dimension 3).
12
Changement de variables Soit Φ un changement de variable bijectif de classe C 1 :
Φ(y1 , . . . , yn ) = (x1 , . . . , xn ). Alors
Z
Z
f (x) dx =
f (Φ(y)) |detJΦ | dy
Φ−1 (D)
D
où JΦ est la matrice jacobienne de Φ (matrice formée des ∂xi /∂yj ).
4.2
Calcul d’une intégrale double
Soit f de IR2 vers IR intégrable sur un domaine D :
— Si D = [a, b] × [c, d], on peut intégrer
indifféremment
par rapport à x puis
à y, ou
Z d Z b
Z b Z d
Z
f (x, y) dx dy
f (x, y) dy dx =
f (x, y) dx dy =
l’inverse :
D
a
c
c
a
Cas particulier :
Z
Z
si f (x, y) = g(x) h(y), alors
Z
a
d
h(y) dy
g(x) dx
f (x, y) dx dy =
D
b
c
— Si D = {(x, y) / a ≤ x ≤ b et ϕ1 (x) ≤ y ≤ ϕ!
2 (x)}, où ϕ1 et ϕ2 sont continues sur
Z
Z b Z ϕ2 (x)
[a, b] :
f (x, y) dx dy =
f (x, y) dy dx (théorème de Fubini, sommation
D
a
ϕ1 (x)
par tranches)
— Si D = {(x, y) / ψ1 (y) ≤ x ≤ ψ2 (y) et c ≤ y !
≤ d}, où ψ1 et ψ2 sont continues sur
Z d Z ψ2 (y)
Z
f (x, y) dx dy (théorème de Fubini, sommation
f (x, y) dx dy =
[c, d] :
D
c
ψ1 (y)
par tranches)
Coordonnées polaires Si Φ est le changement de variables (r, θ) → (x, y) = (r cos θ, r sin θ),
on a : |detJΦ | = r
4.3
Calcul d’une intégrale triple
Les principes vus dans le cas d’une intégrale double (ordre d’intégration, théorème de
Fubini) s’étendent naturellement au cas des intégrales triples.
Coordonnées cylindriques Si Φ est le changement de variables (r, θ, z) → (x, y, z) =
(r cos θ, r sin θ, z), on a : |detJΦ | = r
Coordonnées sphériques Si Φ est le changement de variables (r, θ, ϕ) → (x, y, z) =
(r cos θ sin ϕ, r sin θ sin ϕ, r cos ϕ), on a : |detJΦ | = r2 sin ϕ
4.4
Formule de Green
Soit D ⊂ IR2 le domaine d’intégration. On note Γ le bord de D. On suppose ici que Γ
est suffisamment lisse, c-à-d constitué d’une réunion finie de courbes de classe C 1 . On oriente
13
la frontière Γ de sorte que D soit constamment sur la gauche. Ainsi, si P et Q sont deux
fonctions de classe C 1 sur un ouvert contenant D, on a la formule de Green-Riemann :
Z
Z ∂Q ∂P
−
dx dy .
[P (x, y) dx + Q(x, y) dy] =
∂x
∂y
Γ
D
5
Optimisation d’une fonction de plusieurs variables
5.1
Extrema des fonctions de IRn vers IR
Soit une fonction f de E ⊂ IRn vers IR.
Définitions
— f admet un minimum local en a si et seulement si il existe un voisinage V de a tel
que ∀x ∈ V , f (x) ≥ f (a).
— f admet un minimum global en a si et seulement si ∀x ∈ E, f (x) ≥ f (a).
— f admet un minimum strict (local ou global) en a si et seulement si on peut
remplacer les inégalités larges par des inégalités strictes pour x 6= a dans les définitions
précédentes.
— De même pour définir un maximum, strict ou non, local ou global.
— Extremum : minimum ou maximum
Définition On dit que a ∈ E est un point critique si et seulement si les dérivées partielles
premières de f en a existent et sont nulles (c’est à dire ∇f (a) = 0).
Théorème On suppose que les dérivées partielles de f existent en un point a n’appartenant
pas au bord de E. Une condition nécessaire pour que f admette un extremum en a est
que ∇f (a) = 0.
Théorème Si E est un domaine fermé et borné, et si f est continue sur E, alors f admet
un minimum et un maximum globaux sur E.
Théorème Les extrema d’une fonction C 1 sur un domaine fermé et borné sont soit des
points critiques, soit des points du bord de E.
5.2
Optimisation des fonctions de IR2 vers IR
Soit une fonction f de E ⊂ IR2 vers IR de classe C 2 au voisinage d’un point critique
(x0 , y0 ). On pose (notations de Monge) :
r=
∂ 2f
(x0 , y0 )
∂x2
s=
∂ 2f
(x0 , y0 )
∂x∂y
t=
∂ 2f
(x0 , y0 )
∂y 2
— Si rt − s2 > 0 et r < 0 : f admet un maximum local strict en (x0 , y0 )
— Si rt − s2 > 0 et r > 0 : f admet un minimum local strict en (x0 , y0 )
— Si rt − s2 < 0 : f a un point-selle (ni min, ni max) en (x0 , y0 )
14
— Si rt−s2 = 0 : on ne peut pas donner de conclusion générale. Il faut étudier localement
le comportement de f au voisinage de (x0 , y0 ).
5.3
Méthode d’approximation des moindres carrés
Une question fréquemment rencontrée est celle de la modélisation du lien existant entre
deux variables X et Y . On dispose en pratique d’un ćhantillon de n mesures {(x1 , y1 ), . . . , (xn , yn )}
de ces deux variables. Si le nuage des points (xi , yi ) semble suivre une certain “ loi ”, on peut
essayer de modéliser cette relation entre X et Y sous la forme
Y = a1 f1 (X) + a2 f2 (X) + · · · + aK fK (X) + ,
où les fk sont des fonctions élémentaires (xα , ln x, exp x, sin x, cos x, . . . ), où les ak sont
les paramètres du modèle (que l’on devra estimer par la suite), et où est l’erreur entre le
modèle et la réalité. On dit alors qu’on explique Y par X, ou encore que Y est la variable
expliquée et X la variable explicative.
A partir des n relations

PK

y1 =

k=1 ak fk (x1 ) + 1


.
.

.
.

.
 .
PK
yi =
k=1 ak fk (xi ) + i


.
.

..
..



PK

yn =
k=1 ak fk (xn ) + n
on peut définir une erreur globale entre le modèle et la réalité :
E(a1 , . . . , aK ) =
n
X
i=1
2i
n
X
2
=
yi − a1 f1 (xi ) − · · · − aK fK (xi )
i=1
La méthode des moindres carrés consiste alors à déterminer les ak qui minimisent cette
erreur. Il suffit pour cela de résoudre le système linéaire de K équations à K inconnues

n
X
∂E



(a
,
.
.
.
,
a
)
=
−2
f1 (xi ) [yi − a1 f1 (xi ) − · · · − aK fK (xi )] = 0
1
K


∂a
1

i=1

..
.


n

X
∂E



 ∂a (a1 , . . . , aK ) = −2 fK (xi ) [yi − a1 f1 (xi ) − · · · − aK fK (xi )] = 0
K
i=1
c’est à dire

n
n
n
X
X
X

2


a1
f1 (xi ) + a2
f1 (xi )f2 (xi ) + · · · + aK
f1 (xi )fK (xi )



i=1
i=1
i=1

=
n
X
i=1
yi f1 (xi )
..
.


n
n
n
n

X
X
X
X

2


fK (xi )f1 (xi ) + a2
fK (xi )f2 (xi ) + · · · + aK
fK (xi ) =
yi fK (xi )
 a1
i=1
i=1
i=1
15
i=1
Lorsque ces valeurs optimales â1 , . . . , âK sont déterminées, l’erreur
v globale E(â1 , . . . , âK ) est
r
u n
u1 X
1
appelée erreur résiduelle, et la valeur
E(â1 , . . . , âK ) = t
2 est appelée écartn
n i=1 i
type résiduel.
• Cas particulier : la régression linéaire simple
La relation pressentie entre X et Y réels est de la forme Y = a X + b.
P
P
On détermine â et b̂ en minimisant l’erreur globale E(a, b) = 2i = (yi − a xi − b)2 , ce
qui conduit à résoudre le système

n
X
∂E



 ∂a (â, b̂) = −2 xi (yi − â xi − b̂) = 0
i=1
n
X

∂E


(â, b̂) = − (yi − â xi − b̂) = 0

∂b
i=1
soit











d’où
â =
!
!
n
n
n
X
X
X
x2i â +
xi y i
xi b̂ =
i=1 !
i=1
i=1
n
n
X
X
xi â + n b̂ =
yi
i=1
i=1
n
1 X
xi yi − x̄ȳ
n i=1
et
n
1 X
(xi − x̄)2
n i=1
b̂ = ȳ − â x̄
On remarque que cette droite de régression passe par le barycentre (x̄, ȳ) du nuage de points.
16
Appendice : polynômes à plusieurs variables
Un polynôme à n variables est une fonction de la forme
X
P (x1 , . . . , xn ) =
ap1 ,...,pn xp11 . . . xpnn
p1 ,...,pn
avec les exposants p1 , . . . , pn entiers et les coefficients ap1 ,...,pn réels.
Le degré total du monôme xp11 . . . xpnn est p1 + · · · + pn .
Le degré partiel par rapport à la variable xi du monôme xp11 . . . xpnn est pi .
Un polynôme est dit homogène de degré p s’il est constitué de monômes dont le degré
total est toujours égal à p.
Le degré total d’un polynôme est le plus haut degré total des monômes qui le composent.
Le degré partiel d’un polynôme par rapport à une variable est le plus haut degré partiel
par rapport à cette variable des monômes qui le composent.
Bibliographie
[1] J. Lelong-Ferrand et J.-M. Arnaudiès : Cours de mathématiques - Tome 4 (chapitres 4 et
5), Dunod.
[2] J.-M. Monier : Analyse MP, Dunod, 2004.
[3] W. Rudin et G. Auliac : Principes d’analyse mathématique, Ediscience 1995.
17
Download