Aller au contenu

« Matrice positive » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Aleks Andre (discuter | contributions)
m TeX : notations courantes et normalisées (cf. ISO 80000-2:2009 et ISO 31-11:1992)
Aucun résumé des modifications
 
(11 versions intermédiaires par 8 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
{{homonymie}}
== Matrice positive ==


En mathématiques, le terme '''matrice positive''' peut désigner deux notions différentes :
=== Définitions ===
Une matrice <math>A</math> de type <math>n \times p</math> est dite '''positive''' lorsque tous ses éléments sont réels [[Nombre positif|positifs]] ; on écrira alors <math> A \geqslant 0 </math>.
Elle est dite <span id="MSP">'''strictement positive'''</span> lorsque tous ses éléments sont strictement positifs ; on écrira alors <math>A>0</math>.


* une [[matrice à coefficients positifs]], notamment en [[théorie des probabilités]],
=== Relation d'ordre sur les matrices réelles ===
* une [[matrice autoadjointe positive]], aussi appelée matrice semi-définie positive, une notion d'[[algèbre bilinéaire]].


Voir aussi [[matrice définie positive]]
<math> A </math> et <math>B</math> étant <math>2</math> matrices réelles <math>n \times p</math> on définit une relation d'ordre partiel sur ces matrices en posant <math>A\leqslant B \quad \stackrel{\text{def}}{\Longleftrightarrow} \quad B-A \geqslant 0</math>.

Il est immédiat que cette relation d'ordre est compatible avec l'addition. De même elle est compatible avec la multiplication (à gauche
ou à droite) par une matrice positive.

== Matrices carrées positives ==

=== Graphe associé ===

À toute matrice carrée positive <math>A\in \mathcal M _n(\mathbb R _+)</math> nous associons le [[Theorie des graphes|graphe (orienté)]] <math>\mathcal G (A)</math> défini par :
* l'ensemble des sommets est <math>\{1,2,...,n\}</math>,
* un arc (orienté) joint le sommet <math>i</math> au sommet <math>j</math> si <math>A_{i,j}>0</math>.

Rappelons par ailleurs qu'un [[Lexique de la théorie des graphes|chemin]] de longueur <math>k\in\mathbb N</math> est une suite de <math>k</math> arcs telle que l'extrémité de chaque arc soit l'origine du suivant. L'origine du premier arc est l'origine du chemin et l'extrémité du dernier arc est l'extrémité du chemin. On peut considérer qu'un chemin de longueur <math>0</math> relie chaque sommet à lui-même.

Il est aisé (par exemple en faisant une récurrence) de vérifier :

{{Théorème|Lemmes|
* <math>\mathcal G (A^k)</math> est le graphe ayant les mêmes sommets que <math>\mathcal G (A)</math> et dans lequel un arc relie <math>i</math> à <math>j</math> s'il existe dans <math>\mathcal G (A)</math> un chemin de longueur <math>k</math> reliant <math>i</math> à <math>j</math>.
* <math>\mathcal G ((A+I)^k)</math> est le graphe ayant les mêmes sommets que <math>\mathcal G (A)</math> et dans lequel un arc relie <math>i</math> à <math>j</math> s'il existe dans <math>\mathcal G (A)</math> un chemin de longueur <math>\leqslant k</math> reliant <math>i</math> à <math>j</math>. (<math>I</math> désigne la matrice unité).
}}


Rappelons qu'un graphe est [[Lexique de la théorie des graphes|fortement connexe]] si pour tout couple <math>(i,j)</math> de sommets il existe un [[Lexique de la théorie des graphes|chemin]] joignant <math>i</math> à <math>j</math>.
Il résulte alors aisément par utilisation du second lemme ci-dessus que <math>\mathcal G (A)</math> est fortement connexe si et seulement s'il existe un naturel <math>k</math> tel que <math>(A+I)^k >0</math>.

Tout chemin dans un graphe peut être simplifié en supprimant les [[Lexique de la théorie des graphes|cycles]] (chemin dont l'origine coïncide avec l'extrémité) parcourus dans ce chemin. Par conséquent un tel chemin simplifié ne peut passer qu'une fois au plus par chaque sommet et est donc de longueur <math>\leqslant n-1 </math>. Le graphe est donc fortement connexe si et seulement s'il existe un naturel <math>k \leqslant n-1</math> tel que <math>(A+I)^k>0</math>.

=== Matrice irréductible ===

Nous dirons que la matrice carrée positive <math>A\in \mathcal M _n (\mathbb R_+)</math> est ''irréductible'' si le graphe <math>\mathcal G(A)</math> est [[Lexique de la théorie des graphes|''fortement connexe'']].

En particulier une matrice [[#MSP|strictement positive]] est irréductible puisque chaque sommet <math>i</math> de <math>\mathcal G (A)</math> est relié à tout sommet <math>j</math> par un arc (chemin de longueur 1).

L'étude ci-dessus montre qu'une caractérisation des matrices positives irréductibles est la suivante : Il existe un naturel <math>k\leqslant n-1</math> tel que <math>(A+I)^k>0</math>.

On peut également caractériser ces matrices positives irréductibles par <math>(A+I)^{n-1}>0</math>.
{{Démonstration|déroulante=oui|
Si <math>(A+I)^{k}>0</math> pour <math>k \leqslant n-1</math> on a <math>(A+I)^{n-1}=(A+I)^{k} (A+I)^{n-1-k}</math>. Mais <math> (A+I)^{n-1-k}</math> est une matrice positive comportant au moins tous les éléments diagonaux strictement positifs. Il est résulte immédiatement que <math>(A+I)^{n-1}>0</math>. L'inverse est trivial en prenant <math>k=n-1</math>.
}}

=== Matrice réductible ===

Il s'agit évidemment d'une matrice carrée positive non irréductible. En plus des caractérisations évidentes obtenues par négation des caractérisations ci-dessus nous avons :
{{Théorème|Lemme|
Soit une matrice carrée positive <math> A \in \mathcal M_n(\mathbb R_+)~~(n\geqslant 2)</math>. Il y a équivalence entre
#<math>A</math> est une matrice réductible.
#Il existe une partition de <math> \{1,2,...,n\}</math> en 2 parties non vides <math>~I,J~</math> telle que <math>\forall i \in I~\forall j\in J\quad A{i,j}=0</math>.
#Il existe une [[matrice de permutation]] <math>S</math> telle que <math>{}^t S A S=S^{-1}AS~(</math><ref name="matpermut">Si <math>\sigma</math> est une permutation de <math>\{1,2,...,n\}</math> la matrice <math>S</math> associée est définie par <math>S_{i,j}=\delta_{i,\sigma(j)}</math> (<math>~\delta</math> symbole de Kronecker). La matrice <math>{}^tS A S</math> s'obtient aussi à partir de <math>A </math> en effectuant la permutation <math>\sigma</math> sur les lignes et colonnes (équivalent respectivement à la multiplication à gauche par <math>{}^tS</math> et à droite par <math>S</math>). Autrement dit <math>({}^t S A S)_{i,j}=A_{\sigma(i),\sigma(j)}</math>.<br />
On remarque que <math>{}^tSAS </math> est strictement positive (resp.irréductible) si et seulement si <math>A</math> l'est. En effet les éléments de <math>{}^tSAS</math> sont ceux de <math>A</math> et de plus comme <math>{}^tS=S^{-1}, \quad \left ({}^tSAS+I\right )^{n-1}={}^tS (A+I)^{n-1}S</math>.
</ref> <math>\,)</math> soit de la forme <math>\begin{pmatrix}B&0\\D&C\end{pmatrix}</math> où <math>B</math> et <math>C</math> sont des matrices carrées de format non nul.
}}

{{Démonstration|déroulante=oui|
<math>(1)~\Rightarrow~(2)</math> :

Le graphe <math>\mathcal G(A)</math> n'est pas fortement connexe. Il y a donc un couple <math>(i,j)</math> de sommets tel qu'il n'existe aucun chemin d'origine <math>i</math> et d'extrémité <math>j</math>. Soient alors <math>I</math> l'ensemble des extrémités de tous les chemins d'origine <math>i</math> et <math> J=\{1,2,...,n\}\smallsetminus I</math>. Ces 2 ensembles de sommets vérifient bien la condition demandée.

<math>(2)~\Rightarrow~(3)</math> :

<math>\mathcal C</math> désignant la base canonique de <math>\mathbb R ^n</math>, désignons par <math>\mathcal C '</math> une base obtenue simplement en réordonnant les vecteurs de <math>\mathcal C</math> de manière à placer d'abord les vecteurs indexés par les éléments de <math>I</math>
et enfin ceux indexés par les éléments de <math>J</math>. <math>S</math> désignant la matrice de passage de <math> \mathcal C</math> à <math> \mathcal C '</math> convient à la demande.

<math>(3)~\Rightarrow~(1)</math> :

D'après la remarque ci-dessus <math>({}^tS A S)_{u,v}=0 ~\Leftrightarrow ~ A_{\sigma(u),\sigma(v)}=0</math>. Désignons par <math>U</math> l'ensemble des naturels <math>\{1,2,...,p\}</math> où <math>p</math> est le format de la matrice <math>B</math> et soit <math>V=\{1,2,...,n\}\smallsetminus U</math>. Posons <math>I=\sigma ^{-1}(U)</math> et <math>J=\sigma ^{-1}(V) (=\{1,2,...,n\}\smallsetminus I)</math>. On a donc
<math>\forall u \in U ~ \forall v \in V \quad A_{\sigma(u),\sigma(v)} =0</math> et par conséquent
<math>\forall i \in I ~ \forall j \in J \quad A_{i,j} =0</math>. Ceci entraîne qu'un sommet du graphe <math>\mathcal G (A)</math> appartenant à <math>I</math> ne peut être l'origine d'un chemin dont l'extrémité soit dans <math>J</math> et que le graphe ne peut être fortement connexe.
}}

== Propriétés spectrales des matrices irréductibles ==

=== Le théorème de Perron-Frobenius ===
{{Théorème|Théorème de Perron-Fobenius|
Soit <math>A</math> une matrice positive irréductible.
* Le [[rayon spectral]] <math>\rho</math> de A est une valeur propre simple de <math>A</math>, et le sous-espace propre associé est une droite vectorielle engendrée par un vecteur (colonne) strictement positif.
* Si <math>s</math> et <math>S</math> sont respectivement le minimum et le maximum des sommes des éléments de chaque ligne de <math>A</math>, on a <math>s \leqslant \rho \leqslant S</math>.
* Si <math>n\geqslant 2 </math> alors <math>\rho>0</math>.
* Soit <math>h</math> le nombre de valeurs propres (complexes) de module <math>\rho</math>. Le spectre de <math>A</math> dans le plan complexe est invariant par la rotation de centre <math>O</math> et d'angle <math>\frac{2\pi}{h}</math>. En outre, si <math>h>1</math>, il existe une [[matrice de permutation]]<ref name="matpermut"/> <math>S</math> telle que <math>{}^tSAS=S^{-1}AS=\begin{pmatrix} 0&A_{1,2}&0&\cdots&0\\0&0&A_{2,3}&\cdots&0\\\vdots\\0&0&0&\cdots&A_{h-1,h}\\A_{h,1}&0&0&\cdots&0\end{pmatrix}</math>, où les blocs diagonaux (nuls) sont carrés.
}}

Voir l'article [[théorème de Perron-Frobenius]].

=== Matrice primitive ===

Définition :<br />
Une matrice carrée positive irréductible de [[rayon spectral]] <math>\rho</math> est dite <span id="Prim">primitive</span> si <math>\rho>0</math> <ref> Si <math>n\geqslant 2</math> on a nécessairement <math>\rho>0</math> (cf. P.F.)</ref> et si <math>\rho</math> est la seule valeur propre (complexe) de module maximal <math>\rho</math>.

{{Théorème|Théorème|
Soit <math>A</math> une matrice primitive de [[rayon spectral]] <math>\rho</math>. Alors la suite <math>\left(\left(\frac 1 {\rho}A\right)^m\right)_{m\in \mathbb N}</math> est convergente.

Sa limite est une matrice strictement positive où toutes les colonnes appartiennent à la droite vectorielle sous-espace propre de <math>A</math> relatif à <math>\rho</math>. Plus précisément cette limite est <math>\frac 1 {\Pi_1(\rho)}B(\rho)</math> où <math>\Pi_1(\lambda)=\Pi(\lambda)/(\lambda-\rho),~\Pi(\lambda)</math> étant le polynôme caractéristique de <math>A</math> et <math>B(\lambda)</math> la comatrice transposée de <math>\lambda I-A</math>.

Les lignes de la limite appartiennent de manière similaire au sous-espace propre à gauche de <math>A</math> relatif à <math>\rho</math> (formé des transposées des vecteurs colonne propres de <math>{}^t A</math> relatif à <math>\rho</math>).
}}

{{Démonstration|déroulante=oui|
Nous appliquerons le résultat suivant<ref>F.R Gantmacher. Théorie des matrices Ch.5 §4 (Ed. Jacques Gabay)</ref> :

:Soient <math>M</math> une matrice carrée complexe, <math>\Pi(\lambda)=\prod_{i=1}^s (\lambda-\lambda_i)^{p_i}</math> son polynôme caractéristique et <math>B(\lambda)</math> la comatrice transposée de <math>\lambda I-M</math>. (Si <math>\lambda</math> n'est pas valeur propre de <math>M,~B(\lambda)= \Pi(\lambda)\;(\lambda I-M)^{-1} </math>).

:Pour toute valeur propre <math>\lambda_i</math> on posera <math>\Pi_i(\lambda)=\Pi(\lambda) / (\lambda-\lambda_i)^{p_i}</math>.

:Soit <math>f \in \mathbb C (\lambda) </math>. Alors <math>f(M)=\sum_{i=1}^s \frac 1 {(p_i-1)!} \left [ \frac {B(\lambda)} {\Pi_i(\lambda)} f(\lambda) \right]^{(p_i-1)}_{\lambda=\lambda_i} </math>.

Appliquons ceci avec la matrice <math>M=A</math> et le polynôme <math>f_m(\lambda)=\left(\frac {\lambda} {\rho} \right )^m \quad (\rho</math> est toujours la valeur propre positive maximale de <math>A </math> et <math> m</math> est un naturel supérieur à l'ordre maximal des valeurs propres (comme racines du polynôme caractéristique de <math>A))</math>.

Nous pouvons choisir <math>\lambda_1=\rho</math>. Comme <math>\rho</math> est valeur propre simple de <math>A</math> d'après P.F. on a <math> p_1=1</math>. Le premier terme de la somme est donc égal à <math>\frac {B(\rho)}{\Pi_1(\rho)}</math>.

Nous allons maintenant montrer que chacun des s-1 autres termes tend vers <math>0</math> lorsque <math> m \rightarrow + \infty</math>. Par la formule de Leibniz le <math> i</math>-ème terme s'écrit <math>\frac 1 {\rho^m}\frac 1 {(p_i-1)!} \sum_{k=0}^{p_i-1} \binom{p_i-1}k \left[ \frac {B(\lambda)}{\Pi_i(\lambda)} \right ]^{(k)}_{\lambda=\lambda_i} m(m-1)...(m-k+1)\lambda_i^{m-k} </math>. Le terme d'ordre <math>k</math> de cette somme (finie) s'écrit <math>\alpha~ m(m-1)...(m-k+1)\left(\frac{\lambda_i}{\rho}\right)^m,\quad \alpha </math> étant une constante (indépendante de <math>m</math>).
Mais par hypothèse <math>\left |\frac{\lambda_i}{\rho}\right |<1</math>. On en déduit bien que ce terme tend vers <math>0</math>.

On a donc <math> \lim_{m\rightarrow +\infty} \left(\frac 1 {\rho} A\right)^m=\frac {B(\rho)}{\Pi_1(\rho)}</math>.

Mais on montre dans la démonstration de P.F. que <math>B(\rho)>0</math>. De plus l'égalité classique <math>(\lambda I-A)B(\lambda)=\Pi(\lambda)I~{}</math> montre en faisant <math>\lambda=\rho</math> que les colonnes de <math>B(\rho)</math> sont vecteurs propres de <math>A</math> relatifs à <math>\rho</math> et donc vecteurs extrémaux.

En travaillant sur la matrice transposée de <math>A</math> (qui a le même polynôme caractéristique que <math>A</math>) on obtient le résultat analogue concernant les lignes de <math>A</math>.
}}

{{Théorème|Théorème|
Soit <math>A</math> une matrice carrée positive. Il y a équivalence entre :
#<math>A </math> est [[#Prim|primitive]]
#Il existe un naturel <math>m</math> tel que <math>A^m>0</math>
}}

{{Démonstration|déroulante=oui|

(1) <math>\Rightarrow</math> (2)

On applique le théorème précédent. <math>\lim_{m\rightarrow \infty} \left(\frac 1 {\rho} A \right)^m</math> est strictement positive et par suite pour <math>m=m_o</math> assez grand <math>\left( \frac 1 {\rho} A \right)^{m_o}>0</math>, ce qui entraîne <math>A^{m_o}>0</math>.

(2) <math>\Rightarrow</math> (1)

Remarquons d'abord que <math>A</math> est irréductible. En effet <math>(A+I)^m\geqslant A^m>0</math> (par exemple par la formule du binôme).

* Traitons d'abord le cas où <math>A</math> est ''strictement positive''.

Soient donc <math>\lambda</math> une valeur propre complexe de A de module maximal <math>\rho</math> et <math>X</math> un vecteur colonne propre associé. <math>|X|</math> est vecteur propre de <math>A</math> relatif à <math>\rho</math> (cf. démonstration du théorème de Perron Frobenius) et est donc strictement positif. Ainsi <math>A|X|=\rho |X|=|AX|</math>. De <math>A|X|=|AX|</math> et <math>A>0</math> on déduit que les éléments de <math>X</math> ont le même argument <math>\alpha</math>. Donc <math>A|X|e^{i\alpha}=\lambda |X|e^{i\alpha}</math> et en simplifiant par <math>e^{i\alpha}</math> on voit que <math>\lambda=\rho</math>.

* Passons maintenant au cas général.

De <math>A^m > 0</math> on déduit par récurrence (<math>A</math> irréductible ne peut avoir une colonne nulle) que <math>\forall q \geqslant m~ A^q >0</math>.
Soit alors <math>\lambda</math> une valeur propre de <math>A</math> de module maximal <math>\rho</math> et <math>X</math> un vecteur propre associé. De <math>AX = \lambda X</math> on déduit
<math>\forall q \geqslant p ~ A^q X = \lambda ^q X</math>. Mais <math>A^q</math> ́étant strictement positive on déduit de ce qui vient d’être montré que <math>\forall q \geqslant p ~ \lambda ^q = \rho^q</math>.

En écrivant que <math>\lambda^m=\rho^m</math> et <math>\lambda^{m+1}=\rho^{m+1}</math> on voit que <math>\lambda=\rho</math> et <math>A</math> est bien primitive.
}}

On remarque qu'en particulier une matrice strictement positive est primitive (c'est dans ce cas des matrices strictement positive qu'O. Perron a établi son théorème en 1907).


Une matrice carrée positive irréductible non primitive est dite '''imprimitive'''. Dans ce cas le nombre <math>h</math> de valeurs propres complexes de module maximal <math>\rho</math> est désigné par '''indice d'imprimitivité''' de <math>A</math>.

== Propriétés spectrales des matrices carrées positives générales ==

Le théorème de Perron Frobenius ne s'applique pas aux matrices réductibles. Cependant il est possible d'en donner une forme affaiblie valable de manière générale.

{{Théorème|Théorème|

Soit <math>A</math> une matrice carrée positive. Elle possède une valeur propre positive (ou nulle) <math>\rho</math> et le sous-espace propre associé comporte au moins un vecteur propre positif. Toute autre valeur propre complexe de <math>A</math> est de module inférieur (ou égal) à <math>\rho</math>.

<math>\rho</math> est compris entre le minimum et le maximum des sommes des éléments des lignes de <math>A</math>.
}}
{{Démonstration|déroulante=oui|

*Commençons par remarquer qu'''une matrice carrée positive <math>A</math> est la limite d'une suite de matrices irréductibles'' (par exemple si <math>U</math> est une matrice strictement positive quelconque on a <math>A=\lim_{m\rightarrow +\infty} (A+\frac 1 m U)</math>).

*''Si <math>A\in \mathcal M_n(\mathbb R_+)~=\lim_{m\rightarrow +\infty} A_m</math> l'ensemble des valeurs propres de l'ensemble des <math>A_m</math> est borné.''
Soit en effet le polynôme caractéristique de <math>A_m:~\Pi_m(\lambda)=\lambda^n+b_{m,1}\lambda^{n-1}+...+b_{m,n}</math>. Pour tout <math>i \in \{1,2,...,n\}\quad b_{m,i}</math> est un polynôme (à coefficients constants) en les éléments de <math>A_m</math> et comme l'ensemble de ces éléments est borné à cause de la convergence de la suite <math>A_m</math> il s'ensuit que l'ensemble des <math>b_{m,i}</math> est borné. <br />

Si maintenant <math>\mu</math> est une racine complexe non nulle de <math>\Pi_m</math> on peut écrire <math>{ } 1+b_{m,1}\frac 1 \mu+... +b_{m,n}\frac 1 {\mu^n}=0</math>. Si l'ensemble des valeurs propres des <math>A_m</math> n'était pas borné on aurait une suite <math>\mu_p</math> de valeurs propres vérifiant <math>\lim_{p\rightarrow +\infty}~|\mu_p|=+\infty</math>. Mais à cause du caractère borné de l'ensemble des <math>b_{m,i}</math> le membre de gauche de l'égalité ci-dessus avec <math>\mu=\mu_p</math> tendrait vers 1, ce qui est clairement contradictoire.

*Soit donc <math>A_m</math> une suite de matrices irréductibles tendant vers <math>A</math>. Pour chaque valeur de <math> m</math> soit <math>\rho_m</math> la valeur propre positive maximale de <math>A_m</math>.<br /> et <math>X_m </math> un vecteur propre associé strictement positif (cf. P.F) qu'on peut choisir normé.

Ordonnons alors pour tout <math>m</math> les valeurs propres (complexes) <math>\lambda_{m,1} , ..., \lambda_{m,n}</math> de <math>A_m</math> dans l’ordre décroissant des modules en plaçant <math>\rho_m</math> en première position : <math>\lambda_{m,1}=\rho_m</math>. L’ensemble des valeurs propres étant borné, on peut extraire de la suite des listes ordonnées ci-dessus une suite encore indexée par <math>m </math> (par abus de langage) telle que <math>\forall i \in \{1,2,...,n\}~\lambda_{m,i} \rightarrow \lambda_i </math> (en particulier <math>\lambda_{m,1}=\rho_m \rightarrow \lambda_1=\rho</math>).

Comme <math>\rho_m > 0</math> il s’ensuit que <math> \rho \geqslant 0 </math>.<br />
Comme <math>\forall i \in \{1,,...,n\}\quad |\lambda_{m,i}|\leqslant \rho_m\qquad \forall i\in \{1,,...,n\}\quad |\lambda_i|\leqslant \rho</math>.

<math>\forall \lambda \in \mathbb C \quad \mathrm{det}(\lambda I - A_m)\rightarrow \mathrm{det} (\lambda I-A)</math> (continuité du déterminant). <br /><br />

Or <math> \mathrm{det}(\lambda I-A_m)=\prod_{i=1}^n (\lambda-\lambda_{m,i})\;\rightarrow\;\prod_{i=1}^n (\lambda-\lambda_i)</math>. Ceci montre que le polynôme caractéristique de <math>A</math> est <math>\Pi_{i=1}^n (\lambda-\lambda_i)</math> et donc que ''les valeurs propres de <math>A</math> sont exactement les <math>\lambda_i</math>.''<br />

Comme pour tout <math>m</math> le vecteur <math>X_m</math> est normé on peut à nouveau de la suite déjà extraite précédemment extraire une suite que nous indexerons encore par <math>m</math> par abus de langage de façon que <math>X_m</math> converge vers un vecteur <math>X</math> non nul (en fait normé).<br />

On a évidemment <math>X\geqslant 0</math> et <math>AX=\rho X</math> par passage à la limite de <math>X_m\geqslant 0</math> et <math>A_m X_m=\rho_m X_m</math>.<br />

Enfin pour chaque <math>m\quad \rho_m </math> est compris entre le minimum et le maximum des sommes des lignes de <math>A_m</math>. Par passage à la limite on obtient l'encadrement annoncé sur <math>\rho</math>.





}}

== Matrices réelles symétriques ==

<!--
Dans ces cas, malgré le risque de confusion, on utilise aussi le vocable de matrice positive pour tout autre chose :

=== Matrice symétrique réelle positive ===
-->

=== Définitions ===

On note <math>\mathcal{S}_n(\mathbb{R})</math>, ou plus simplement <math>\mathcal{S}_n</math> s'il n'y a pas de confusion possible, l'ensemble des matrices carrées d'ordre <math>n</math> [[matrice symétrique|symétriques]] à coefficients réels. On note <math>M_{I,J}</math> la sous-matrice de <math>M\in\mathcal{S}_n</math> formée de ses éléments avec indices de ligne dans <math>I</math> et indices de colonne dans <math>J</math>. L'opérateur [[Déterminant (mathématiques)|déterminant]] est désigné par « <math>\det</math> ».

On dit qu'une matrice <math>M\in\mathcal{S}_n</math> est '''positive''' (ou '''semi-définie positive''') si elle vérifie l'une des propriétés équivalentes suivantes :
<!--
{| cellspacing="0" cellpadding="4"
|-
|valign="top"| '''1.''' || la [[forme bilinéaire symétrique]] qu'elle représente est positive, c'est-à-dire : pour toute [[matrice colonne]] <math>\ \textbf{x}</math> à <math>n</math> éléments réels, on a
:<math>\textbf{x}^{T} M\, \textbf{x} \geqslant 0</math>,
|-
|valign="top"| '''2.''' || les [[Valeur propre (synthèse)|valeurs propres]] de <math>M</math> (qui sont automatiquement réelles) sont positives ou nulles, c'est-à-dire :
:<math>\ \mathrm{Sp}(M) \subset\, [0,\, +\infty[\,</math>.
|}
-->
# <math>M</math> est un {{Lien|trad=Positive element|élément positif}} de <math>\mathcal M _n(\R)</math>,
# la [[forme bilinéaire symétrique]] associée est positive : pour tout <math>x\in\mathbb{R}^n</math>, <math>{}^tx Mx \geqslant 0</math>,
# les [[Valeur propre (synthèse)|valeurs propres]] de <math>M</math> (qui sont nécessairement réelles) sont positives,
# tous les [[Mineur (algèbre linéaire)|mineurs principaux]] de <math>M</math> sont positifs : pour tout <math>I\subset\{1,\ldots,n\}</math> non vide, <math>\det M_{I,I}\geqslant0</math>.

On note <math>\mathcal{S}_n^+(\mathbb{R})</math>, ou plus simplement <math>\mathcal{S}_n^+</math> s'il n'y a pas de confusion possible, la partie de <math>\mathcal{S}_n</math> formée des matrices positives. Par l'expression 1, <math>\mathcal{S}_n^+</math> peut se voir comme ''une intersection de demi-espaces'' (en nombre infini). Par l'expression 3 (exercice 4.1 chez Ben-Tal et Nemirovski (2001)<ref>{{en}} A. Ben-Tal, A. Nemirovski (2001). ''Lectures on Modern Convex Optimization – Analysis, Algorithms, and Engineering Applications''. MPS-SIAM Series on Optimization 2. SIAM.</ref>), <math>\mathcal{S}_n^+</math> peut se voir comme ''un ensemble semi-algébrique de base'' (i.e., donné par un nombre fini d'inégalités polynomiales).

Une matrice symétrique réelle '''[[Matrice définie positive|définie positive]]''' est une matrice symétrique réelle positive inversible.

=== Exemples ===

* Soit <math>f</math> une fonction réelle de <math>n</math> variables réelles, définie sur un ouvert de <math>\mathbb{R}^n</math>, dérivable dans un voisinage d'un point <math>x</math> de cet ouvert et deux fois dérivable en ce point. Si <math>f</math> atteint un minimum local en <math>x</math>, sa [[matrice hessienne]] y est positive<ref>L'exemple des fonctions constantes montre qu'elle n'est pas nécessairement définie positive</ref> ([[Conditions d'optimalité (dimension finie)#Conditions du deuxième ordre sans contrainte|condition nécessaire d'optimalité du second ordre sans contrainte]]).

* Étant donné un vecteur aléatoire <math>(T_1,\dots, T_n)</math> à valeurs dans <math>\mathbb{R}^n</math> dont chaque composante admet une variance, on définit sa matrice des covariances :<br /><br /><center><math>\Gamma = \Big(\mathrm{cov}(T_i, T_j) \Big) \in \mathcal{S}_n.</math></center><br />Celle-ci est positive. En effet, pour toute matrice colonne <math>x</math> à <math>n</math> éléments réels notés <math>x_1,\dots, x_n</math> : <br /><br /><center><math>{}^tx \Gamma x = \mathrm{Var}(x_1\, T_1 +\cdots + x_n\, T_n) \geqslant 0.</math></center><br />Elle est définie positive si et seulement si la seule combinaison linéaire de <math>T_1,\dots, T_n</math> qui soit certaine est celle dont tous les coefficients sont nuls.

* Pour toute matrice réelle <math> A</math>, la matrice <math>{}^tAA</math> est une matrice symétrique positive. Cette dernière matrice est définie positive si et seulement si <math>A</math> est injective.
<!--
De plus, si <math>A</math> est une matrice carrée inversible, <math>A^T.A</math> est définie positive.
-->

=== Propriétés ===

* Toute matrice réelle symétrique positive admet une unique [[racine carrée d'une matrice|racine carrée]] réelle symétrique positive. Plus formellement :<br /><br /><center><math> \forall\, S\in \mathcal{S}_n^+,\quad\exist\,!\, T\in \mathcal{S}_n^+,\quad T^2=S.</math></center><br />Ce résultat se généralise aux racines <math>n</math>-ièmes.

=== Cône des matrices symétriques semi-définies positives ===

Les expressions définissant la semi-définie positivité montrent clairement que
{{Bloc emphase|fond=#ffeedd|bord=1px solid #ff8822;|espacement=1.5ex|<math>\mathcal{S}_n^+</math> est un [[Cône (géométrie)|cône]] [[ensemble convexe|convexe]] [[Fermé (topologie)|fermé]] non vide de <math>\mathcal{S}_n</math>.}}

On note <math>\mathcal{N}(A)</math> le [[Noyau (algèbre)#Noyau d'une application linéaire|noyau]] de <math>A\in\mathcal{S}_n</math>. Le [[Cône tangent#Cône tangent|cône tangent]] à <math>\mathcal{S}_n^+</math> en <math>A\in\mathcal{S}_n^+</math> s'écrit
{{Bloc emphase|fond=#ffeedd|bord=1px solid #ff8822;|espacement=1.5ex|<math>T_A\mathcal{S}_n^+=\{D\in\mathcal{S}_n \mid \forall v\in\mathcal{N}(A), {}^tvDv\geqslant0\}</math>.}}

On note <math>\mathcal{S}_n^-=-\mathcal{S}_n^+</math>, <math>\mathbb{R}\,A\stackrel{\text{def}}{=}\{tA:t\in\mathbb{R}\}</math> (pour <math>A\in\mathcal{S}_n</math>) et on suppose que l'espace vectoriel <math>\mathcal{S}_n</math> est muni du produit scalaire
<center>
<math>
(A,B)\in\mathcal{S}_n\times\mathcal{S}_n\mapsto\langle A,B\rangle=\operatorname{tr}(AB),
</math>
</center>
où <math>\operatorname{tr}</math> désigne la [[Trace (algèbre)|trace]]. Alors, le [[Cône tangent#Cône normal|cône normal]] à <math>\mathcal{S}_n^+</math> en <math>A\in\mathcal{S}_n^+</math> s'écrit
{{Bloc emphase|fond=#ffeedd|bord=1px solid #ff8822;|espacement=1.5ex|<math>N_A\mathcal{S}_n^+=\{N\in\mathcal{S}_n^- \mid \langle A,N\rangle=0\}=\mathcal{S}_n^-\cap(\mathbb{R}\,A)^\perp</math>.}}

== Matrices complexes hermitiennes ==

On étend les propriétés et définitions précédentes aux matrices complexes [[hermitien]]nes.

Soit <math>M</math> une matrice hermitienne d'ordre ''n''. Elle est dite '''positive''' si elle vérifie l'une des deux propriétés équivalentes suivantes :

{| cellspacing="0" cellpadding="4"
|-
|valign="top"| '''1.''' || Pour toute matrice colonne <font style="vertical-align:+10%;"><math>\ \textbf{z}</math></font> à <math>n</math> éléments complexes, on a
:<math>\textbf{z}^{*} M \textbf{z} \geqslant 0</math> (où <font style="vertical-align:+25%;"><math>\textbf{z}^{*}</math></font> désigne la matrice transconjuguée de <math>\ \textbf{z}</math>).
|-
|valign="top"| '''2.''' || Toutes les valeurs propres de <math>M</math> sont positives, c'est-à-dire :
:<math>\ \mathrm{Sp}(M) \subset\, [0,\, +\infty[\,</math>.
|}

De la même manière une matrice hermitienne '''définie positive''' est une matrice hermitienne positive inversible.

== Notes ==

{{références|colonnes=2}}

{{Palette Matrices}}
{{portail mathématiques}}

[[Catégorie:Algèbre bilinéaire]]
[[Catégorie:Matrice remarquable|positive]]

Dernière version du 6 février 2020 à 18:48

En mathématiques, le terme matrice positive peut désigner deux notions différentes :

Voir aussi matrice définie positive