Codage disjonctif complet

Un article de Wikipédia, l'encyclopédie libre.

Le codage disjonctif complet est utilisé en analyse de données Il permet de transformer des variables qualitatives en des variables de type quantitatif entre lesquelles il est permis de calculer des corrélations.

Exemple :

	Température (°)	Vanadium (grammes)	Fournisseur n°	Rigidité
Essai1	103	21	1	19
Essai2	115	28	2	25
Essai3	99	28	3	21
Essai4	102	23	1	22
Essai4	97	25	3	24

La colonne Fournisseur ne peut être laissée telle quelle. Les nombres qu’elle contient ne sont pas des mesures dans une unité donnée, mais des numéros arbitraires. Nous n’avons pas le droit de calculer le coefficient de corrélation entre la colonne fournisseur et une autre colonne. Il nous faut d’abord ventiler cette variable « qualitative » en trois variables indicatrices de type présence-absence, comme ci-dessous (codage « disjonctif complet »):

	Température (°)	Vanadium (grammes)	F1	F2	F3	Rigidité
Essai 1	103	21	1	0	0	19
Essai 2	115	28	0	1	0	25
Essai 3	99	28	0	0	1	21
Essai 4	102	23	1	0	0	22
Essai 4	97	25	0	0	1	24

Maintenant il est permis de calculer les corrélations deux à deux entre les colonnes du tableau.

Catégorie : Analyse des données (statistiques)

Views

Contribuer

Rechercher

Cette page a été modifiée pour la dernière fois le 7 mai 2008 à 01:26 par Utilisateur Guil2027. Basé sur le travail de Utilisateur(s) Lesty.
Droit d'auteur : Tous les textes sont disponibles sous les termes de la licence de documentation libre GNU (GFDL).
Wikipedia® est une marque déposée de la Wikimedia Foundation, Inc., organisation de bienfaisance régie par le paragraphe 501(c)(3) du code fiscal des États-Unis.
À propos de Wikipédia
Avertissements

Codage disjonctif complet

Un article de Wikipédia, l'encyclopédie libre.

Views

Navigation

Contribuer

Rechercher