Lemme de CousinEn mathématiques, le lemme de Cousin (du nom du mathématicien français[1] Pierre Cousin) est une propriété de la droite réelle équivalente à l'existence de la borne supérieure pour les parties non vides et majorées de ℝ. Il joue un rôle important dans l'intégrale de Kurzweil-Henstock, mais permet également de démontrer directement des théorèmes d'analyse. HistoriqueEn 1894, Pierre Cousin[2], alors élève de Henri Poincaré[réf. souhaitée], démontra une variante du théorème de Borel-Lebesgue[3], connue parfois à présent sous le nom de théorème de Cousin[N 1], mais ce travail fut pour l'essentiel ignoré, et fut redécouvert indépendamment par Borel et Lebesgue quelques années plus tard. Le lemme de Cousin en est une simple conséquence dans le cas d'un intervalle réel ; ce nom lui fut donné par Kurzweil et Henstock en raison de l'importance de cette forme du théorème de Borel dans la définition de leur intégrale. ÉnoncéLe lemme de Cousin s'énonce comme suit[4] :
On dit que ti marque le segment [xi–1, xi], et que la subdivision (xi) marquée par les points ti est δ-fine[4],[5]. On utilisera souvent le fait qu'alors, [xi–1, xi] est inclus dans [ti – δ(ti), ti + δ(ti)]. L'intégrale de Kurzweil-HenstockL'intégrale de Riemann est une définition de l'intégrale généralement accessible aux étudiants de premier cycle universitaire, mais elle présente plusieurs inconvénients. Un certain nombre de fonctions relativement simples ne possèdent pas d'intégrale au sens de Riemann, par exemple la fonction de Dirichlet. Par ailleurs, cette théorie de l'intégration rend malaisées les démonstrations et l'utilisation des théorèmes puissants d'intégration, tels que le théorème de convergence dominée, le théorème de convergence monotone ou le théorème d'interversion série-intégrale. Ces lacunes sont comblées par l'intégrale de Lebesgue mais celle-ci est plus complexe et difficilement accessible dans les premières années du supérieur. Kurzweil et Henstock ont proposé une théorie de l'intégration, guère plus difficile que la théorie de Riemann, mais aussi puissante que la théorie de Lebesgue, en posant[7] :
Si l'on prend des jauges constantes, on retrouve l'intégrale de Riemann. Dans cette théorie, le lemme de Cousin joue un rôle essentiel. Quelques applications en analyseNous donnons ci-dessous quelques exemples de propriétés susceptibles d'être directement démontrées au moyen du lemme de Cousin. Dans chacun des cas, il suffit de choisir une jauge adéquate. Existence de la borne supérieureLa propriété de la borne supérieure, qui a permis de démontrer le lemme de Cousin pour ℝ, lui est en fait équivalente (pour tout corps totalement ordonné K)[8]. En effet, si A est une partie de K sans borne supérieure, contenant un élément a et majorée par un élément b, montrons que le lemme de Cousin n'est pas satisfait pour la jauge suivante sur [a, b] :
Si [a, b] possédait une subdivision marquée ((xi), (ti)) δ-fine, on aurait :
Par conséquent, de proche en proche (à partir de b) tous les xi et les ti majoreraient A, ce qui contredirait l'hypothèse initiale (a = x0 serait le plus grand élément de A). Soit f continue sur un segment [a, b]. Supposons que f n'admet pas de maximum et montrons qu'alors, le lemme de Cousin n'est pas satisfait pour la jauge suivante sur [a, b] : pour tout t dans [a, b], puisque f(t) n'est pas maximum, il existe y tel que f(t) < f(y) ; l'application f étant continue, il existe δ(t) > 0 tel que f([t – δ(t), t + δ(t)]) < f(y). Si [a, b] possédait une subdivision marquée ((xi), (ti)) δ-fine, on aurait : pour chaque i, il existe yi tel que f(ti) < f(yi). Soit k tel que f(yk) soit le plus grand des f(yi). L'élément yk est dans l'un des intervalles [xi–1, xi] de la subdivision, mais il doit alors vérifier, comme les autres éléments de cet intervalle : f(yk) < f(yi), ce qui est contradictoire avec la maximalité de f(yk). Soit f continue sur [a, b] et ne s'annulant pas. Montrons que f est de signe constant, en appliquant le lemme de Cousin à la jauge suivante sur [a, b] :
Soit ((xi), (ti)) une subdivision marquée δ-fine, alors f est de signe constant sur chaque intervalle [xi–1, xi] donc sur tout l'intervalle [a, b]. Le théorème de Heine dans le cas réelSoit f continue sur [a, b], et soit ε > 0. Pour tout t, il existe δ(t) > 0 tel que f([t – δ(t), t + δ(t)]) est inclus dans ]f(t) – ε/2, f(t) + ε/2[. Soient ((xi), (ti)) une subdivision marquée δ/2-fine, puis η le plus petit des δ(ti)/2. Si x et y sont tels que |x – y| ≤ η, et si x est dans l'intervalle [xi–1, xi], alors |x – ti| ≤ δ(ti)/2 et |y – ti| ≤ δ(ti)/2 + η ≤ δ(ti), de sorte que f(x) et f(y) sont tous deux dans f([ti – δ(ti), ti + δ(ti)]) donc dans ]f(ti) – ε/2, f(ti) + ε/2[. Il en résulte que |f(x) – f(y)| < ε. On a ainsi montré que f est uniformément continue[9]. Soit f continue sur [a, b], et soit ε > 0. L'application f étant continue, pour tout t de [a, b], il existe δ(t) > 0 tel que f(]t – δ(t), t + δ(t)[) est inclus dans ]f(t) – ε, f(t) + ε[. Soient ((xi), (ti)) une subdivision marquée δ-fine, puis φ la fonction en escalier définie comme suit :
Alors, φ approche f uniformément à ε près. Soit f continue sur [a, b] et à valeurs dans le cercle unité 𝕌 du plan complexe. Pour tout t, il existe δ(t) > 0 tel que f([t – δ(t), t + δ(t)]) soit inclus dans 𝕌 privé d'un point. L'application f possède alors un relèvement local sur [t – δ(t), t + δ(t)]. Par exemple, si f([t – δ(t), t + δ(t)]) est inclus dans 𝕌\{–1}, on prendra comme relèvement (à un multiple de 2π près) la fonction θ égale à arccos(Re(f)) si Im(f) ≥ 0 et à –arccos(Re(f)) si Im(f) ≤ 0. Si l'on considère une subdivision marquée δ-fine ((xi), (ti)) de [a, b], on obtient un relèvement local θi sur chaque sous-intervalle [xi–1, xi] de la subdivision. On obtiendra un relèvement global continu en ajoutant au besoin à la fonction θi+1 le nombre θi(xi) – θi+1(xi), de façon à obtenir la continuité au point xi. Soit une suite réelle bornée, donc à valeurs dans un segment [a, b].
Le lemme de Cousin affirme l'existence d'une subdivision marquée δ-fine. Cela impose nécessairement au moins un marqueur du type (i), car si tous les marqueurs étaient du type (ii), la suite n'aurait qu'un nombre fini de termes. Le théorème de Borel-Lebesgue dans le cas réelSoit (Oi) une famille d'ouverts recouvrant un segment [a,b]. Pour tout t de [a,b], t est dans l'un des Oi. Ce dernier étant ouvert, il existe δ(t) > 0 tel que l'intervalle [t – δ(t), t + δ(t)] soit inclus dans Oi. Le lemme de Cousin affirme l'existence d'une subdivision marquée δ-fine. Chaque intervalle de cette subdivision est inclus dans l'un des Oi, ce qui définit un recouvrement de [a,b] par un nombre fini d'ouverts Oi[10]. Soit f une fonction continue définie sur un intervalle réel I et dont la dérivée f ' est définie et nulle, sauf en un nombre dénombrable de points. Alors f est constante[11]. En effet, soit ε > 0. Posons :
Pour tout [a, b] dans I, le lemme de Cousin fournit une subdivision marquée δ-fine. En distinguant les marqueurs du type (i) et du type (ii), on obtient |f(b) – f(a)| < 2ε + 2ε(b – a), car b – a est un majorant de la somme des longueurs des intervalles de la subdivision du type (ii). L'inégalité étant vraie pour tout ε > 0, il en résulte que f(a) = f(b). Fonction lipschitzienne à dérivée nulle presque partoutSoit f une fonction M-lipschitzienne sur un intervalle réel I et dont la dérivée f ' est définie et nulle presque partout. Alors f est constante[12]. En effet, soit ε > 0 et soit U un ouvert de mesure inférieure à ε contenant les points où la dérivée de f est non nulle ou non définie.
Pour tout [a, b] dans I, le lemme de Cousin fournit une subdivision marquée δ-fine. En distinguant les marqueurs du type (i) et du type (ii), on obtient |f(b) – f(a)| < M ε + 2ε(b – a), car b – a est un majorant de la somme des longueurs des intervalles de la subdivision du type (ii). L'inégalité étant vraie pour tout ε > 0, il en résulte que f(a) = f(b). Une démonstration analogue s'applique aux fonctions absolument continues[12]. Le théorème fondamental de l'analyseSoit F dérivable sur [a, b] de dérivée f. Alors f, bien que non nécessairement continue, est KH-intégrable et [13]. En effet, soit ε > 0. Pour tout t de [a, b], il existe δ(t) > 0 tel que, pour tout x dans [a, b] tel que 0 < |x – t| ≤ δ(t), on ait : ou encore : pour tout x dans [a, b] tel que |x – t| ≤ δ(t), Pour toute subdivision marquée ((xi), (ti)) δ-fine, on aura donc : et en sommant ces inégalités : Or cette inégalité signifie que f est KH-intégrable et que son intégrale vaut F(b) – F(a). On peut montrer que la conclusion reste vraie si F est dérivable sauf en un nombre dénombrable de points[14]. Notes et référencesNotes
Références
|