Regroupement hiérarchique

Un article de Wikipédia, l'encyclopédie libre.

Ce type de classification se déroule en trois étapes :

1. trouver les similarités entre les paires d’objets ;

2. grouper les objets sous la forme d’un arbre, ceci est réalisé en considérant chaque élément dans une classe et regrouper les deux classes les plus proches au sens d’une distance ;

3. déterminer la coupe d’arbre en définissant le nombre de classes souhaité. On appelle dendrogramme l’arbre binaire reflétant la structure des données et permettant de regrouper les données similaires. Cependant, l’inconvénient avec une telle approche est la détermination du seuil de la coupe, ainsi que l’absence de chevauchement des classes. Une donnée peut être proche thématiquement d'autres données appartenant à deux classes différentes.

[modifier] Articles connexes