Loi de probabilité à plusieurs variables

Un article de Wikipédia, l'encyclopédie libre.

Dans certains problèmes interviennent simultanément plusieurs variables aléatoires. Mis à part les cas particuliers de variables indépendantes (notion définie ci-dessous) et de variables liées fonctionnellement, cela introduit la notion de loi de probabilité à plusieurs variables autrement appelée loi jointe. La description des notions correspondantes, certaines d'entre elles généralisant les notions relatives à une seule variable, est simplifiée de deux manières:

  • Seules les variables continues sont considérées. Il est possible de passer aux variables discrètes en utilisant la fonction de Heaviside et la fonction de Dirac.
  • Pour éviter la lourdeur des formules, l'exposé est limité à deux variables.

Sommaire

[modifier] Formules de base

La probabilité pour que la variable aléatoire X\, prenne une valeur numérique inférieure à x\, tandis que Y\, prend une valeur inférieure à y\, définit la fonction de répartition :

F(x,y) = \mathcal{P}(X<x,Y<y)

Celle-ci est non décroissante en x\, et en y\, entre la valeur 0 lorsque les deux variables tendent vers -\infty\, et la valeur 1 lorsqu'elles tendent toutes deux vers +\infty\,.

La densité de probabilité jointe ou loi jointe s'obtient par une double dérivation :

p_{XY}(x,y) = \frac{\partial F_{XY}}{\partial x \partial y}

Une intégration par rapport à y\, (resp. x\,) donne la densité de probabilité marginale ou loi marginale de X\,(resp. Y\,) :

p_X (x) = \int_{-\infty}^\infty p_{XY}(x,y) \mathrm dy

Le rapport de la densité de probabilité jointe (relative à une valeur x\,) à la densité marginale de Y\, (concernant toutes les valeurs x\,) représente la densité de probabilité conditionnelle de X\, sous la condition Y = y\, :

 p_{X|Y}(x,y) = \frac {p_{XY}(x,y)} {p_{Y}(y)}

[modifier] Espérances mathématiques

L'espérance mathématique d'une fonction f\, de deux variables généralise la formule donnée pour une seule variable :

\mathbb{E}[f(X,Y)] = \int_{-\infty}^\infty \int_{-\infty}^\infty\ f(x,y) p_{XY}(x,y) \mathrm dx \mathrm dy

L'opérateur espérance est linéaire ; en particulier, l'espérance (la moyenne) d'une somme de deux variables aléatoires est la somme des moyennes :

\mathbb{E}[X + Y] = \mathbb{E}[X] + \mathbb{E}[Y]\,

Parmi ces espérances, une double transformation de Fourier conduit à la fonction caractéristique:

\varphi_{XY} (\theta,\psi) = \mathbb{E}[e^{i(\theta X + \psi Y)}]

Comme pour le cas d'une seule variable aléatoire un développement en série permet de faire apparaître les moments que l'on peut centrer par soustraction des moyennes.

[modifier] Indépendance

Si la densité de probabilité conditionnelle de X\, par rapport à Y\, est identique à la densité marginale :

 p_{X}(x) = \frac {p_{XY}(x,y)} {p_{Y}(y)}

on dit que les deux variables sont indépendantes. L'égalité se réécrit :

p_{XY}(x,y) = p_{X}(x) p_{Y}(y)\,

La fonction caractéristique de la somme des variables est alors égale au produit des fonctions caractéristiques individuelles :

Z = X + Y \qquad \varphi_{Z} (\theta) = \varphi_{X} (\theta) \varphi_{Y} (\theta)

C'est l'une des principales propriétés de la fonction caractéristique. Cette remarque est, entre autre, utilisée dans la démonstration du théorème de la limite centrale.

[modifier] Corrélation

On appelle corrélation de deux variables aléatoires la grandeur:

\rho=\frac{\mathbb{E}[(X-\overline X) (Y -\overline Y)]}{\sigma(X)\sigma(Y)}

\sigma(X)=\sqrt{\mathbb{E}(X-\overline{X})^2} est la variance. La corrélation de deux variables est comprises entre -1 et 1. Pour une corrélation proche de 1 la variable X aura tendance à être grande quand Y le sera et vice versa. Pour une corrélation proche de -1 la variable X aura tendance à être petite quand Y le sera grande. Si la covariance est nulle on dit que les deux variables sont décorrélées. La formule se développe alors en:

E[XY] = E[X] E[Y]\,

Si les deux variables sont indépendantes, elles sont décorrélées, l'inverse n'étant pas vrai, car l'indépendance implique tous les moments au lieu d'un seul. La notion de variables décorrélées est plus faible que celle d'indépendance et est loin d'avoir la même utilité.


modifier Articles de mathématiques en rapport avec les probabilités ou les statistiques
Statistiques descriptivesAnalyse des donnéesVisualisation des donnéesEstimateursTests statistiquesSéries temporelles et économétrieStatistique MathématiqueThéorie des probabilitésVariables aléatoiresInégalitésThéorèmes limitesProcessus stochastiquesLa mécanique statistiqueLes statistiques et l'économieLes statistiques et la sociologieLes statistiques et les sciencesLes probabilités et les jeux • Les équations aux dérivées partielles et les probabilités