UE MAT234 Notes de cours sur les fonctions de plusieurs variables 1 1.1 1.1.1 Fonctions de plusieurs variables réelles L’espace Rn , définition et géométrie. Distance sur Rn . Dans ce cours, nous allons considérer des fonctions dépendant de plusieurs variables : mathématiquement, ceci veut dire que ce sont des fonctions définies sur (une partie de) l’espace Rn . Nous commençons donc par quelques éléments sur cet espace. Définition 1 Un élément de l’espace Rn est un n-uplet (x1 , . . . , xn ) ou chaque xi est un numbre réel. Noter que dans ce cours, un élément de Rn est un vecteur ligne. Ceci est une convention qui permet de simplifier la notation, mais qui n’est pas universelle, certains auteurs préférant écrire les éléments de Rn comme des vecteurs colonnes. Les valeurs numériques xi s’appellent les coordonnées cartesiennes du point (x1 , . . . , xn ). Nous verrons plus loin d’autres systèmes de valeurs numériques qui peuvent être utilisés pour caractériser un point dans Rn . Le produit scalaire (euclidien) sur R3 est donné par (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = x1 y1 + x2 y2 + x3 y3 . Cette structure se généralise aussi à Rn : Définition 2 Soient v = (x1 , . . . , xn ) et w = (y1 , . . . , yn ) des vecteurs de Rn . On pose alors v · w = x1 y1 + . . . + xn yn . On se rappelle que le théorème de Pythagore nous permet de calculer la distance entre deux vecteurs de R2 ou R3 . Par exemple, si w1 = (x1 , y1 , z1 ) et w2 = (x2 , y2 , z2 ) sont deux points dans R3 , alors la distance entre w1 et w2 est donnée par p d(w1 , w2 ) = (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 , et la longueur d’un vecteur w = (x, y, z) dans R3 est donnée par p kwk = x2 + y 2 + z 2 . La forme de ces deux expressions suggère naturellement la définition suivante. 1 Définition 3 Soient v1 = (x1 , . . . xn ) et v2 = (y1 , . . . , yn ) deux points dans Rn . Alors la distance (euclidienne) entre v1 et v2 est définie par p d(v1 , v2 ) = (x1 − y1 )2 + . . . + (xn − yn )2 . La norme (euclidienne) ou la longueur d’un vecteur v = (x1 , . . . , xn ) ∈ Rn est donée par q kvk = x21 + . . . + x2n . La norme de Rn s’écrit simplement en termes du produit scalaire : √ kvk = v · v, et d(v1 , v2 ) = kv1 − v2 k = p (v1 − v2 ) · (v1 − v2 ) Par ailleurs, on a v · w = kvkkwk cos θ ou θ est l’angle entre v et w. Définissons enfin le produit vectoriel : Définition 4 Soient v = (x1 , x2 , x3 ) et w = (y1 , y2 , y3 ) des vecteurs de R3 . On définit le produit vectoriel v ∧ w par v ∧ w = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ) . Le produit vectoriel a les propriétés suivantes. 1. v ∧ w = −w ∧ v et en particulier v ∧ v = 0 2. (v ∧ w) · v = (v ∧ w) · w = 0. 3. kv ∧ wk = kvkkwk | sin θ| ou θ est l’angle entre v et w. 1.1.2 Systèmes alternatifs de coordonnées sur Rn . Dans certaines applications, notamment en R2 et R3 , il peut être utile de caractériser les points de l’espace par d’autes systèmes de coordonnées. Commençons par préciser ce que veut dire un système de coordonnées. Définition 5 Soit D ⊂ Rn un domaine dans Rn . Un système de coordonnées sur D est une bijection Φ : D → D0 donné par Φ : (x1 , . . . , xn ) → (y1 , . . . , yn ) l’ensemble D0 étant un domaine de Rn . 2 Intuitivement, si P = (x1 , . . . , xn ) est un point de D alors les nombres (y1 , . . . , yn ) = Φ(P ) donnent un étiquettage alternatif de P . Nous passons maintenant en revue les trois systèmes de coordonnées alternatifs les plus utilisés. Coordonnées polaires. C’est un système de coordonnées sur R2 \ {0}. On identifie le vecteur v = (x, y) avec les données (r, θ) ou — r > 0 est le rayon c’est à dire, la distance entre v et l’origine 1 — θ est l’angle entre v et l’axe des x dans le sens trigonométrique. L’angle θ ∈ [0, 2π[ est uniquement caractérisé par les équations x = r cos θ, y = r sin θ. Nous appelons le couple (r, θ) les coordonnées polaires du point (x, y). Ce changement de coordonnées (x, y) −→ (r, θ) est bijectif de IR2 /{(0, 0)} vers IR∗+ × [0, 2π[. Le changement inverse est : p 1. r = x2 + y 2 2. θ est l’unique angle tel que cos θ = p x x2 + y2 et sin θ = p y x2 + y2 . Coordonnées cylindriques. Un point M (x, y, z) de IR3 peut aussi être repéré par ses coordonnées cylindriques (r, θ, z). Dans ce trio, la coordonné z ne change pas, mais les coordonnées (x, y) et y sont remplacés par les coordonnées polaires définies par x = r cos θ, y = r sin θ, avec r > 0 et θ ∈ [0, 2π[. Coordonnées sphériques. Un point M (x, y, z) de IR3 peut aussi être repéré par ses coordonnées sphériques (r, θ, ϕ), définies par x = r cos ϕ sin θ, y = r sin ϕ sin θ, z = r cos θ, avec r 1. 2. 3. > 0, θ ∈]0, π[ et ϕ ∈ [0, 2π[. C’est un système de repérage usuel sur une sphère. r est appelé rayon ou distance au centre, ϕ longitude, θ colatitude (π/2 − ϕ est la latitude). 1. Par le théorème de Pythagore, on a donc r = p x2 + y 2 . 3 1.2 Définition des fonctions de plusieurs variables. Vous avez déjà étudié en MAT203 les fonctions d’une seule variable, c’est à dire, des règles mathématiques qui associent à un nombre réel 2 x un autre nombre réel f (x). Or, la plupart des quantités rencontrées en physique ne dépendent pas d’une seule, mais de plusieurs variables. Par exemple, la pression ou la temperature peuvent varier avec trois variables de l’espace (x, y, z) et avec le temps t. Ils sont donc répresentés par des fonctions P (x, y, z, t) = pression au point (x, y, z) en un temps t et T (x, y, z, t) = température au point (x, y, z) en un temps t. De même, l’énérgie d’un particule qui évolue sous l’effet d’un potentiel dépendra non seulement de la position du particule, mais aussi de sa vitesse. On la répresente donc par une fonction de six variables (trois variables de position du particule, et trois variables de vitesse). Il convient donc d’essayer de généraliser l’étude des fonctions d’une seule variable à des fonctions pouvant dépendre de plusieurs variables. Définition 6 Une fonction réelle de n variables, f , est une fonction définie sur un sousensemble Df ⊂ Rn et qui à chaque vecteur x ∈ Df associe une valeur numérique f (x). f : Df ⊂ IRn −→ IR (x1 , . . . , xn ) −→ f (x1 , . . . , xn ) La région Df ou la fonction f est définie s’appelle le domaine de définition de la fonction. On travaillera souvent avec n = 2 ou n = 3. On utilisera parfois dans ce cas la notation (x, y) ou (x, y, z) plutôt que (x1 , x2 ) ou (x1 , x2 , x3 ). Exemples v u n uX x2i — Longueur (ou norme) d’un vecteur : f (x1 , . . . , xn ) = t i=1 — Température en un point : c’est une fonction de la position (x, y, z) et du temps t : T (x, y, z, t) Le but de la première partie de ce cours sera de tenter de généraliser aux fonctions de plusieurs variables les propriétés et opérations de base - continuité, dérivation, integration - que vous connaissez déjà pour les fonctions d’une seule variable. Le cas de la continuité est simple, puisque la définition donnée dans le cadre des fonctions d’une seule variable se généralise sans difficulté. Définition 7 Soit f : Df ⊂ IRn −→ IR une fonction de plusieurs variables. On dit que f est continue en a = (a1 , . . . , an ) si et seulement si pour chaque suite xi telle que xi → a nous avons que f (xi ) → f (a). Ici, on considère que xi → a si et seulement si d(xi , a) → 0. 2. Qui doit parfois satisfaire à certaines conditions : par exemple, de x positives ou nulles. 4 √ x n’est définie que pour des valeurs 1.2.1 Généralisation : fonctions de IRn vers IRp On peut généraliser de façon naturelle les fonctions de IRn vers IR et introduire des fonctions de IRn vers IRp pour p > 1 : f : Df ⊂ IRn −→ IRp (x1 , . . . , xn ) −→ (f1 (x1 , . . . , xn ), . . . , fp (x1 , . . . , xn )) où chaque fonction fi est une fonction de IRn vers IR. Exemple : Considèrons une fluide en mouvement dans un domaine D ∈ R3 . On peut assigner à chaque point x ∈ D le vecteur vélocité instantanée v(x) de l’élément de fluide se trouvant au point x au temps t = 0. Ceci est une fonction v : D → R3 . 1.2.2 Répresentations graphiques des fonctions de deux variables réelles On considère ici f de IR2 vers IR. Représentation 3-D : on trace en perspective dans IR3 la surface formée des points (x, y, f (x, y)). Représentation par lignes de niveaux : on trace dans le plan les lignes de niveau de la fonction. L’isoligne de niveau ` est {(x, y) : f (x, y) = `} 2 2 Exemple : La ligne √ de niveau ` (` ≥ 0) de la fonction f (x, y) = x + y est le cercle de centre 0 de rayon `. 2 Dérivation d’une fonction de plusieurs variables 2.1 Dérivées premières Soit f de IRn vers IR, (e1 , . . . , en ) la base canonique de IRn , et a ∈ IRn . Définition Soit d un vecteur de IRn . On appelle dérivée directionnelle de f au point ∂f (a) : a dans la direction d, notée ∂d ∂f f (a + αd) − f (a) f (a1 + αd1 , . . . , an + αdn ) − f (a1 , . . . , an ) (a) = lim = lim α→0 α→0 ∂d α α La dérivée directionnelle ∂f /∂d est donc une fonction de IRn vers IR. 5 si elle existe Exemples : — La pente d’un relief dans une direction donnée est la dérivée directionnelle dans cette direction. √ 3 1 — Soit f (x, y) = x3 y − y et d = ( , ). On a : 2 2 √ 3 2 ∂f 3 3 (x, y) = x y + (x − 1). ∂d 2 2 — En physique, on parle souvent de dérivée normale et de dérivée tangentielle pour désigner la dérivée directionnelle en un point d’une courbe ou d’une surface donnée, dans la direction normale ou tangente à cette courbe ou surface. Définition On appelle dérivée partielle de f par rapport à la i-ème variable xi la dérivée ∂f directionnelle de f dans la direction ei . Elle est notée . ∂xi En pratique on calcule ∂f /∂xi comme une dérivée classique, en supposant les variables x1 ,. . .,xi−1 ,xi+1 ,. . .,xn constantes et en dérivant par rapport à xi . Définition Le vecteur ∂f ∂f (a), . . . , (a) est appelé gradient de f au point a, noté ∂x1 ∂xn gradf (a) ou ∇f (a). Définitions On dit que f est de classe C 1 en a si chaque dérivée partielle existe au voisinage de a et est continue en a. Propriété Si f est C 1 en a alors pour tout vecteur direction d nous avons que ∂f (a) = ∇f (a) · d ∂d Définition On suppose que f est de classe C 1 en a. On appelle différentielle de f en a l’application linéaire notée Df [a] définie par Df [a] : IRn −→ IR h = (h1 , . . . , hn ) −→ Df [a](h) = n X ∂f ∂xi i=1 (a) hi = ∇f (a)·h On utilise souvent la notation dxi pour répresenter l’application linéaire dxi : (x1 , . . . , xn ) → xi . La différentielle f en a s’écrit alors n X ∂f Df [a] = dxi . ∂xi i=1 Notons que ∂f (a) = Df [a](h). ∂h 6 Propriété On a que f (a + h) = f (a) + Df [a](h) + o(khk). C’est l’équivalent de la formule des accroissements finis pour les fonctions d’une seule variable. La differentielle d’une fonction f définie sur un domain Df nous donne pour chaque point a ∈ Df une application linéaire Df [a] : Rn → R. La notion de forme differentielle généralise cette idée. Définition. Soit D un domaine de Rn . Une forme différentielle ω sur D est une fonction qui associe à chaque point de a ∈ D une application linéaire ω[a] : Rn → R. Une forme differentielle ω s’écrit sous la forme ω = g1 dx1 + g2 dx2 + . . . + gn dxn , et on a alors ω[a](h) = n X gi (a)hi . i=1 La différentielle d’une fonction f est la forme différentielle particulière : X ∂f dxi . Df [a] = ∂xi i On dit dans ce cas que la forme différentielle est exacte. Définition Soit f de IRn vers IRp : f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fp (x1 , . . . , xn )). f est de classe C 1 en a ∈ IRn si et seulement si chaque application composante fi l’est. La différentielle de f en a ∈ IRn s’écrit alors : Df [a](h) = (Df1 [a](h), . . . , Dfp [a](h)), soit en abrégé Df [a] = (Df1 [a], . . . , Dfp [a]). Ainsi, puisque Dfi [a](h) = ∇fi ·h, on a, avec des notations en vecteurs colonnes : ∂f1 ∂f1 [a] · · · [a] ∂x1 h Df1 [a](h) 1 ∂x n . .. .. .. .. .. , Df [a](h) = = . . . . h ∂fp ∂fp Dfp [a](h) n [a] · · · [a] ∂x1 ∂xn Définition Soit f : Rn → Rp une fonction C 1 , définie au point a. On appelle matrice jacobienne de f au point a la matrice ∂f1 ∂f1 ∂x1 [a] · · · ∂xn [a] .. .. .. Jf (a) = . . . ∂fp ∂fp [a] · · · [a] ∂x1 ∂xn Nous avons en particulier que pour tout a ∈ Df et tout h, notation en vecteurs colonnes : Df [a](h) = Jf (a)h. 7 Exemple On reprend l’exemple du changement de variables en coordonnées polaires x = r cos θ, y = r sin θ. L’application des résultats précédents donne dx cos θ −r sin θ dr = dy sin θ r cos θ dθ 2.2 Dérivation de fonctions composées Propriété Soit f : E1 ⊂ IRn → IRp et g : E2 ⊂ IRp → IR. On suppose, pour que g ◦ f soit définie, que f (E1 ) ⊂ E2 . Soit a ∈ E1 . On suppose que f est différentiable en a et que g est différentiable en f (a). Alors g ◦ f est différentiable en a et D(g ◦ f )[a] = Dg[f (a)] ◦ Df [a]. En écriture matricielle, ceci est équivalent à Jg◦f (a) = Jg (f (a)) Jf (a) Application au changement de variables Soit Φ un changement de coordonnées (x1 , . . . , xn ) → (y1 , . . . , yn ). Soit f une fonction de classe C 1 et g = f ◦ Φ : g(x1 , . . . , xn ) = f (y1 , . . . , yn ). La propriété précédente s’écrit n ∀i = 1, . . . , n X ∂f ∂yk ∂g (x1 , . . . , xn ) = (y1 , . . . , yn ) ∂xi ∂yk ∂xi k=1 Cette formule est parfois appelée formule des dérivées totales. Exemple Soit une fonction f de IR2 vers IR. On note g son expression en coordonnées polaires g(r, θ) = f (r cos θ, r sin θ) = f (x, y). On a alors : y ∂f ∂f ∂g = ∂f ∂x + ∂f ∂y = cos θ ∂f + sin θ ∂f = p x +p ∂x ∂r ∂y ∂r ∂x ∂y ∂r x2 + y 2 ∂x x2 + y 2 ∂y ∂g ∂f ∂x ∂f ∂y ∂f ∂f ∂f ∂f = + = −r sin θ + r cos θ = −y +x ∂θ ∂x ∂θ ∂y ∂θ ∂x ∂y ∂x ∂y qui s’inverse en ∂f ∂g 1 ∂g = cos θ − sin θ ∂x ∂r r ∂θ ∂f ∂g 1 ∂g = sin θ + cos θ ∂y ∂r r ∂θ 2.3 Dérivées d’ordres supérieurs Soit une fonction f de E ⊂ IRn vers IR. 8 Définition Soient {i1 , . . . , ik } ∈ {1, . . . , n}k . On dit que f admet une dérivée partielle n d’ordre k au pointa ∈ IR xik si et seulement si par rapport aux variables xi1, . . . , ∂f ∂ ∂f ∂ ∂f ∂f — , ,..., ··· ··· ∂xi1 ∂xi2 ∂xi1 ∂xik−1 ∂xik−2 ∂xi1 existent dans un de a et voisinage ∂f ∂f ∂ — ∂xi ∂xi · · · ∂xi · · · (a) existe k 1 k−1 On note cette dérivée ∂kf (a). ∂xik . . . ∂xi1 Définition On dit que f est de classe C k sur E si et seulement si toutes les dérivées partielles de f jusqu’à l’ordre k existent et sont continues sur E. Théorème de Schwarz Si f est de classe C 1 sur E, si ∂ 2f ∂ 2f et existent sur E ∂xi ∂xj ∂xj ∂xi ∂ 2f ∂ 2f (a) = (a). ∂xi ∂xj ∂xj ∂xi On en déduit que, pour f de classe C k , l’ordre de dérivation dans le calcul des dérivées partielles n’a pas d’importance. et sont continues en a, alors 2.4 Formule de Taylor à l’ordre 2 Soit une fonction f de IRn vers IR, de classe C 2 . Soit a = (a1 , . . . , an ). On a alors pour tout incrément h = (h1 , . . . , hn ) : f (a + h) = f (a) + n X i=1 n hi n 1 XX ∂f ∂ 2f (a) + hi hj (a) + o(khk2 ) ∂xi 2 i=1 i=1 ∂xi ∂xj Dans le cas d’une fonction de deux variables, cette formule devient : f (x + h, y + k) = f (x, y) + h + ∂f ∂f (x, y) + k (x, y) ∂x ∂y h2 ∂ 2 f ∂ 2f k2 ∂ 2f (x, y) + hk (x, y) + (x, y) + o(kh, kk2 ) 2 2 2 ∂x ∂x∂y 2 ∂y On peut aussi l’exprimer sous la forme suivante : il existe θ ∈]0, 1[ tel que f (x + h, y + k) = f (x, y) + h + 3 ∂f ∂f (x, y) + k (x, y) ∂x ∂y h2 ∂ 2 f ∂ 2f k2 ∂ 2f (x + θh, y + θk) + hk (x + θh, y + θk) + (x + θh, y + θk) 2 ∂x2 ∂x∂y 2 ∂y 2 Opérateurs aux dérivées partielles Beaucoup de phénomènes physiques peuvent être traduits par des équations aux dérivées partielles, dans lesquelles apparaissent quelques opérateurs usuels. 9 3.1 Opérateurs usuels n 1 Gradient Soit une fonction f de IR vers IR de classe C . On a déjà défini le gradient ∂f ∂f de f au point a : (a), . . . , (a) , noté gradf (a) ou ∇f (a). ∂x1 ∂xn En tout point a ∈ IR2 , ∇f (a) est orthogonal à la ligne de niveau f (a). Divergence Soit une fonction f de IRn vers IRn (on dit aussi “champ de vecteurs”) de classe C 1 . On note f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fn (x1 , . . . , xn )). On appelle divergence de f la fonction de IRn vers IR définie par div f = ∂fn ∂f1 + ··· + . ∂x1 ∂xn Cet opérateur caractérise la convergence ou la divergence ponctuelle d’un champ de vecteurs. On note aussi div f = ∇·f Laplacien Soit une fonction f de IRn vers IR de classe C 2 . On appelle laplacien de f la fonction de IRn vers IR, notée ∆f ou ∇2 f , définie par ∆f = ∂ 2f ∂ 2f + · · · + ∂x21 ∂x2n On a : ∆f = div (∇f ). Les fonctions f vérifiant ∆f = 0 sont appelées fonctions harmoniques. Elles interviennent notamment dans la résolution de l’équation des ondes et de l’équation de la chaleur (voir plus loin). On peut aussi étendre la définition du laplacien à des champs de vecteurs : soit f de IRn vers IRp de classe C 2 : f (x1 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fp (x1 , . . . , xn )). On définit alors ∆f = (∆f1 , . . . , ∆fp ). Rotationnel Soit f de IR3 vers IR3 de classe C 1 : f (x, y, z) = (f1 (x, y, z), f2 (x, y, z), f3 (x, y, z)). On appelle rotationnel de f la fonction de IR3 vers IR3 , notée rot f et définie par : ∂f3 ∂f2 ∂f1 ∂f3 ∂f2 ∂f1 − , − , − rot f = ∂y ∂z ∂z ∂x ∂x ∂y Cette quantité caractérise le mouvement de rotation du champ de vecteurs f autour de chaque axe. On note aussi : rot f = ∇ ∧ f Par abus de langage, on parle aussi parfois du rotationnel d’un champ de vecteurs f de IR2 ∂f2 ∂f1 vers IR2 , en le définissant comme la fonction de IR2 vers IR : rot f = − ∂x ∂y Equations aux dérivées partielles usuelles La plupart des phénomènes physiques peuvent être décrits, tout au moins de façon simplifiée, par des équations aux dérivées partielles (EDP) qui traduisent en général des principes tels que conservation de la masse, de la chaleur, de la quantité de mouvement. . . Les opérateurs précédents interviennent très souvent dans ces EDP. Par exemple : 10 ∂f (x, t) = div (ν(x) grad f ) (x, t) où f est la température et ∂t ∂f ν la diffusivité thermique. Cette équation devient (x, t) = ν ∆f (x, t) si ν est constante. ∂t ∂ 2f • équation des ondes : 2 (x, t) = c2 ∆f (x, t) où c est la célérité des ondes. ∂t • équation de la chaleur : 3.2 Quelques propriétés Linéarité Gradient, divergence, laplacien et rotationnel sont des opérateurs linéaires. On a donc T (f + g) = T (f ) + T (g) et T (λf ) = λT (f ), où T représente n’importe lequel de ces opérateurs. Composition d’opérateurs Pour les propriétés qui suivent, f et g sont des fonctions de IRn vers IR, et u est un champs de vecteurs de IRn vers IRn . Ces fonctions seront de classe C 1 ou C 2 suivant le contexte, et on supposera n = 3 lorsqu’on fera intervenir le rotationnel. On a alors : grad (f g) = f grad g + g grad f div (f u) = f div u + grad f ·u rot (f u) = f rot u − u ∧ grad f div (rot u) = 0 rot (grad f ) = 0 rot (rot u) = grad (div u) − ∆u Expressions en coordonnées polaires On note (O, i, j) le repère orthonormé cartésien de IR2 . Pour un point M de coordonnées cartésiennes (x, y) et de coordonnées polaires (r, θ), on définit le vecteur → unitaire ur = cos θ i + sin θ j, c’est à dire OM = rur . Soit uθ le vecteur unitaire qui lui est directement orthogonal : uθ = − sin θ i + cos θ j. • Soit f de IR2 vers IR de classe C 1 . On note g son expression en coordonnées polaires : f (x, y) = g(r, θ). On a alors : ∇f = ∂f ∂g 1 ∂g ∂f i+ j= ur + uθ ∂x ∂y ∂r r ∂θ • Soit f de IR2 vers IR de classe C 2 . On note g son expression en coordonnées polaires : f (x, y) = g(r, θ). On a alors : ∆f = ∂ 2f ∂ 2f ∂ 2 g 1 ∂g 1 ∂ 2g + = + + ∂x2 ∂y 2 ∂r2 r ∂r r2 ∂θ2 • Soit f un champ de vecteurs de IR2 vers IR2 de classe C 1 . On note f (M ) = f1 (x, y) i + f2 (x, y) j = g1 (r, θ) ur + g2 (r, θ) uθ . Alors : div f = ∂g1 1 1 ∂g2 + g1 + ∂r r r ∂θ 11 Expressions en coordonnées cylindriques Les expressions du laplacien et de la divergence se déduisent des expressions en coordonnées polaires. Soit f de IR3 vers IR. On note g son expression en coordonnées cylindriques : f (x, y, z) = g(r, θ, z). On a alors : ∇f = ∆f = ∂f ∂f ∂g 1 ∂g ∂g ∂f i+ j+ k= ur + uθ + k ∂x ∂y ∂y ∂r r ∂θ ∂z ∂ 2f 1 ∂ 2g ∂ 2g ∂ 2f ∂ 2f ∂ 2 g 1 ∂g + + + = + + ∂x2 ∂y 2 ∂z 2 ∂r2 r ∂r r2 ∂θ2 ∂z 2 Soit maintenant f de IR3 vers IR3 de classe C 1 . On note (O, i, j, k) le repère orthonormé cartésien de IR3 . Pour un point M de coordonnées cartésiennes (x, y, z) et de coordonnées cylindriques (r, θ, z), on note f (M ) = f1 (x, y, z) i+f2 (x, y, z) j+f3 (x, y, z) k = g1 (r, θ, z) ur +g2 (r, θ, z) uθ +g3 (r, θ, z) k. Alors : 1 ∂g2 ∂g3 ∂g1 1 + g1 + + div f = ∂r r r ∂θ ∂z ∂g2 1 ∂g3 ∂g1 ∂g3 1 ∂(rg2 ) 1 ∂g1 rot f = − + − − ur + uθ + k ∂z r ∂θ ∂z ∂r r ∂r r ∂θ 4 4.1 Intégrales multiples Quelques propriétés La notion de fonction intégrable pour les fonctions de plusieurs variables est une généralisation directe de la même notion pour les fonctions d’une seule variable. Pour Zf fonction de IRn vers IR intégrable, son intégrale sur un domaine D est notée Z Z . . . f (x1 , . . . , xn ) dx1 . . . dxn , ou encore en abrégé f (x) dx. D D Soient f et g des fonctions de IRn vers IR intégrables sur un domaine D de IRn . On a les propriétés Z suivantes Z: Z Z Z — (f + g) = f+ g et λf = λ f ∀λ ∈ IR (linéarité) D D D D ZD Z Z — Si f ≥ 0 sur D alors f ≥ 0. On en déduit que, si f ≥ g sur D, alors f≥ g. D D D Z Z — Si f est intégrable sur D alors |f | l’est aussi, et |f | ≥ f . D Z D — Si f ≥ 0 sur D, si f est continue sur D, et si f = 0, alors f = 0 sur D. D Z 2 Z Z 2 2 — fg ≤ f g (Inégalité de Schwarz) D D D Z Z Z On a aussi la relation de Chasles : f= f+ f pour des domaines D1 et D2 D1 ∪D2 D1 D2 dont l’intersection est de mesure nulle (c’est à dire de surface nulle en dimension 2, ou de volume nul en dimension 3). 12 Changement de variables Soit Φ un changement de variable bijectif de classe C 1 : Φ(y1 , . . . , yn ) = (x1 , . . . , xn ). Alors Z Z f (x) dx = f (Φ(y)) |detJΦ | dy Φ−1 (D) D où JΦ est la matrice jacobienne de Φ (matrice formée des ∂xi /∂yj ). 4.2 Calcul d’une intégrale double Soit f de IR2 vers IR intégrable sur un domaine D : — Si D = [a, b] × [c, d], on peut intégrer indifféremment par rapport à x puis à y, ou Z d Z b Z b Z d Z f (x, y) dx dy f (x, y) dy dx = f (x, y) dx dy = l’inverse : D a c c a Cas particulier : Z Z si f (x, y) = g(x) h(y), alors Z a d h(y) dy g(x) dx f (x, y) dx dy = D b c — Si D = {(x, y) / a ≤ x ≤ b et ϕ1 (x) ≤ y ≤ ϕ! 2 (x)}, où ϕ1 et ϕ2 sont continues sur Z Z b Z ϕ2 (x) [a, b] : f (x, y) dx dy = f (x, y) dy dx (théorème de Fubini, sommation D a ϕ1 (x) par tranches) — Si D = {(x, y) / ψ1 (y) ≤ x ≤ ψ2 (y) et c ≤ y ! ≤ d}, où ψ1 et ψ2 sont continues sur Z d Z ψ2 (y) Z f (x, y) dx dy (théorème de Fubini, sommation f (x, y) dx dy = [c, d] : D c ψ1 (y) par tranches) Coordonnées polaires Si Φ est le changement de variables (r, θ) → (x, y) = (r cos θ, r sin θ), on a : |detJΦ | = r 4.3 Calcul d’une intégrale triple Les principes vus dans le cas d’une intégrale double (ordre d’intégration, théorème de Fubini) s’étendent naturellement au cas des intégrales triples. Coordonnées cylindriques Si Φ est le changement de variables (r, θ, z) → (x, y, z) = (r cos θ, r sin θ, z), on a : |detJΦ | = r Coordonnées sphériques Si Φ est le changement de variables (r, θ, ϕ) → (x, y, z) = (r cos θ sin ϕ, r sin θ sin ϕ, r cos ϕ), on a : |detJΦ | = r2 sin ϕ 4.4 Formule de Green Soit D ⊂ IR2 le domaine d’intégration. On note Γ le bord de D. On suppose ici que Γ est suffisamment lisse, c-à-d constitué d’une réunion finie de courbes de classe C 1 . On oriente 13 la frontière Γ de sorte que D soit constamment sur la gauche. Ainsi, si P et Q sont deux fonctions de classe C 1 sur un ouvert contenant D, on a la formule de Green-Riemann : Z Z ∂Q ∂P − dx dy . [P (x, y) dx + Q(x, y) dy] = ∂x ∂y Γ D 5 Optimisation d’une fonction de plusieurs variables 5.1 Extrema des fonctions de IRn vers IR Soit une fonction f de E ⊂ IRn vers IR. Définitions — f admet un minimum local en a si et seulement si il existe un voisinage V de a tel que ∀x ∈ V , f (x) ≥ f (a). — f admet un minimum global en a si et seulement si ∀x ∈ E, f (x) ≥ f (a). — f admet un minimum strict (local ou global) en a si et seulement si on peut remplacer les inégalités larges par des inégalités strictes pour x 6= a dans les définitions précédentes. — De même pour définir un maximum, strict ou non, local ou global. — Extremum : minimum ou maximum Définition On dit que a ∈ E est un point critique si et seulement si les dérivées partielles premières de f en a existent et sont nulles (c’est à dire ∇f (a) = 0). Théorème On suppose que les dérivées partielles de f existent en un point a n’appartenant pas au bord de E. Une condition nécessaire pour que f admette un extremum en a est que ∇f (a) = 0. Théorème Si E est un domaine fermé et borné, et si f est continue sur E, alors f admet un minimum et un maximum globaux sur E. Théorème Les extrema d’une fonction C 1 sur un domaine fermé et borné sont soit des points critiques, soit des points du bord de E. 5.2 Optimisation des fonctions de IR2 vers IR Soit une fonction f de E ⊂ IR2 vers IR de classe C 2 au voisinage d’un point critique (x0 , y0 ). On pose (notations de Monge) : r= ∂ 2f (x0 , y0 ) ∂x2 s= ∂ 2f (x0 , y0 ) ∂x∂y t= ∂ 2f (x0 , y0 ) ∂y 2 — Si rt − s2 > 0 et r < 0 : f admet un maximum local strict en (x0 , y0 ) — Si rt − s2 > 0 et r > 0 : f admet un minimum local strict en (x0 , y0 ) — Si rt − s2 < 0 : f a un point-selle (ni min, ni max) en (x0 , y0 ) 14 — Si rt−s2 = 0 : on ne peut pas donner de conclusion générale. Il faut étudier localement le comportement de f au voisinage de (x0 , y0 ). 5.3 Méthode d’approximation des moindres carrés Une question fréquemment rencontrée est celle de la modélisation du lien existant entre deux variables X et Y . On dispose en pratique d’un ćhantillon de n mesures {(x1 , y1 ), . . . , (xn , yn )} de ces deux variables. Si le nuage des points (xi , yi ) semble suivre une certain “ loi ”, on peut essayer de modéliser cette relation entre X et Y sous la forme Y = a1 f1 (X) + a2 f2 (X) + · · · + aK fK (X) + , où les fk sont des fonctions élémentaires (xα , ln x, exp x, sin x, cos x, . . . ), où les ak sont les paramètres du modèle (que l’on devra estimer par la suite), et où est l’erreur entre le modèle et la réalité. On dit alors qu’on explique Y par X, ou encore que Y est la variable expliquée et X la variable explicative. A partir des n relations PK y1 = k=1 ak fk (x1 ) + 1 . . . . . . PK yi = k=1 ak fk (xi ) + i . . .. .. PK yn = k=1 ak fk (xn ) + n on peut définir une erreur globale entre le modèle et la réalité : E(a1 , . . . , aK ) = n X i=1 2i n X 2 = yi − a1 f1 (xi ) − · · · − aK fK (xi ) i=1 La méthode des moindres carrés consiste alors à déterminer les ak qui minimisent cette erreur. Il suffit pour cela de résoudre le système linéaire de K équations à K inconnues n X ∂E (a , . . . , a ) = −2 f1 (xi ) [yi − a1 f1 (xi ) − · · · − aK fK (xi )] = 0 1 K ∂a 1 i=1 .. . n X ∂E ∂a (a1 , . . . , aK ) = −2 fK (xi ) [yi − a1 f1 (xi ) − · · · − aK fK (xi )] = 0 K i=1 c’est à dire n n n X X X 2 a1 f1 (xi ) + a2 f1 (xi )f2 (xi ) + · · · + aK f1 (xi )fK (xi ) i=1 i=1 i=1 = n X i=1 yi f1 (xi ) .. . n n n n X X X X 2 fK (xi )f1 (xi ) + a2 fK (xi )f2 (xi ) + · · · + aK fK (xi ) = yi fK (xi ) a1 i=1 i=1 i=1 15 i=1 Lorsque ces valeurs optimales â1 , . . . , âK sont déterminées, l’erreur v globale E(â1 , . . . , âK ) est r u n u1 X 1 appelée erreur résiduelle, et la valeur E(â1 , . . . , âK ) = t 2 est appelée écartn n i=1 i type résiduel. • Cas particulier : la régression linéaire simple La relation pressentie entre X et Y réels est de la forme Y = a X + b. P P On détermine â et b̂ en minimisant l’erreur globale E(a, b) = 2i = (yi − a xi − b)2 , ce qui conduit à résoudre le système n X ∂E ∂a (â, b̂) = −2 xi (yi − â xi − b̂) = 0 i=1 n X ∂E (â, b̂) = − (yi − â xi − b̂) = 0 ∂b i=1 soit d’où â = ! ! n n n X X X x2i â + xi y i xi b̂ = i=1 ! i=1 i=1 n n X X xi â + n b̂ = yi i=1 i=1 n 1 X xi yi − x̄ȳ n i=1 et n 1 X (xi − x̄)2 n i=1 b̂ = ȳ − â x̄ On remarque que cette droite de régression passe par le barycentre (x̄, ȳ) du nuage de points. 16 Appendice : polynômes à plusieurs variables Un polynôme à n variables est une fonction de la forme X P (x1 , . . . , xn ) = ap1 ,...,pn xp11 . . . xpnn p1 ,...,pn avec les exposants p1 , . . . , pn entiers et les coefficients ap1 ,...,pn réels. Le degré total du monôme xp11 . . . xpnn est p1 + · · · + pn . Le degré partiel par rapport à la variable xi du monôme xp11 . . . xpnn est pi . Un polynôme est dit homogène de degré p s’il est constitué de monômes dont le degré total est toujours égal à p. Le degré total d’un polynôme est le plus haut degré total des monômes qui le composent. Le degré partiel d’un polynôme par rapport à une variable est le plus haut degré partiel par rapport à cette variable des monômes qui le composent. Bibliographie [1] J. Lelong-Ferrand et J.-M. Arnaudiès : Cours de mathématiques - Tome 4 (chapitres 4 et 5), Dunod. [2] J.-M. Monier : Analyse MP, Dunod, 2004. [3] W. Rudin et G. Auliac : Principes d’analyse mathématique, Ediscience 1995. 17