Méthode des K-means - Université Lumière Lyon 2

Algorithme K-Means ? Méthode des centres mobiles. 3. Cas des variables actives qualitatives. 4. Fuzzy C-Means. 5. Classification de variables. 6. Conclusion.

Part of the document

Ricco Rakotomalala
Université Lumière Lyon 2
PLAN
1.Position du problème ȂLa classification automatique
2.Algorithme K-MeansȂMéthode des centres mobiles
3.Cas des variables actives qualitatives
4.FuzzyC-Means
5.Classification de variables
6.Conclusion
7.Bibliographie

Ricco Rakotomalala
Constitution des groupes à partir des caractéristiques de proximité

Ricco Rakotomalala
Classification automatique
Typologie, apprentissage non-supervisé, clustering
Objectif : identifier des groupes
ǯ
ȋǤǯ
clients, caractère " polluant » de
véhicules, etc.)
On veut que :
(1) Les individus dans un même groupe
se ressemblent le plus possible
(2) Les individus dans des groupes
différents se démarquent le plus possible
Pourquoi ?
Identifier des structures sous-jacentes
dans les données
Résumer des comportements
Affecter de nouveaux individus à des
catégories
Identifier les cas totalement
similaires » (c.-à-d. qui se ressemblent au regard de leurs propriétés)
Variables "actives», servent à la constitution des groupes.

PANDA 541108150354159154860135
TWINGO 601149151344163143840143
YARIS 65998155364166150880134
CITRONC2 611124158367166147932141
CORSA 7012481653841651441035127
FIESTA 6813991643921681441138117
CLIO 1001461185382164142980113
P1007 7513601653741691611181153
MODUS 11315981883801701591170163
MUSA 10019101793991701691275146
GOLF 7519681634211761491217143
MERC_A 14019912013841771601340141
AUDIA3 10215951854211771431205168
CITRONC4 13819972074261781461381142
AVENSIS 11519951954631761481400155
VECTRA 15019102174601801461428159
PASSAT 15017812214711751471360197
LAGUNA 16519982184581781431320196
MEGANECC 16519982254361781411415191
P407 13619972124681821451415194
P307CC 18019972254351761431490210
PTCRUISER 22324292004291711541595235
MONDEO 14519992154741941431378189
MAZDARX8 23113082354431771341390284
VELSATIS 15021882004861861581735188
CITRONC5 21024962304751781481589238
P607 20427212304911841451723223
MERC_E 20432222434821831461735183
ALFA 156 25031792504431751411410287
BMW530 23129792504851851471495231

Ricco Rakotomalala
Classification automatique
Illustration graphique dans le plan


On "devine» les amas de points dans
mettre en évidence les groupes "naturels» c.-à-d. qui se
démarquent significativement les uns des autres.
2 questions clés1.Combien de groupes ?
2.Délimitation de ces groupes par le calcul

Ricco Rakotomalala
Tutoriels Tanagra -http://tutoriels-data-mining.blogspot.fr/6
Caractérisation de la partition
Inertie intra-classes W