Utilisateur:Frounze/traduction en cours

Un article de Wikipédia, l'encyclopédie libre.

En statistique, la distance de Mahalanobis est une mesure de distance introduite par P. C. Mahalanobis en 1936. Elle est basée sur la corrélation entre des variables par lesquelles différents modèles peuvent être identifiés et analysés. C'est une manière utile de déterminer la similarité entre une série de données connues et inconnues. Elle diffère de la distance euclidienne par le fait qu'elle prenne en compte la corrélation de la série de données.

Pratiquement, la distance de Mahalanobis d'une série de valeurs de moyenne \mu = ( \mu_1, \mu_2, \mu_3, \dots , \mu_p ) et possédant une matrice de covariance Σ pour un vecteur à plusieurs variables x = ( x_1, x_2, x_3, \dots, x_p ) est définie comme suit:

D_M(x) = \sqrt{(x - \mu)^T \Sigma^{-1} (x-\mu)}.\,

La distance de Mahalanobis peut aussi être définie comme étant la mesure de dissimilarité entre deux vecteurs aléatoires  \vec{x} et  \vec{y} de même distribution avec une matrice de covariance Σ :

 d(\vec{x},\vec{y})=\sqrt{(\vec{x}-\vec{y})^T\Sigma^{-1} (\vec{x}-\vec{y})}.\,

Si la matrice de covariance est la matrice identitaire, cette distance est alors la même que la distance euclidienne. Si la matrice de covariance est diagonale, elle est appelée distance euclidienne normalisée:

 d(\vec{x},\vec{y})=
\sqrt{\sum_{i=1}^p  {(x_i - y_i)^2 \over \sigma_i^2}}

σi est l'écart-type de xi sur la série de données.

Modèle:Statistics-stubfr:Distance de Mahalanobis

Autres langues