Confrontare kmeans() e hclust()
Confrontando k-means e il clustering gerarchico, vedrai che i due metodi producono appartenenze ai cluster diverse. Questo perché gli algoritmi fanno ipotesi differenti su come vengono generati i dati. In un corso più avanzato, potremmo scegliere un modello rispetto a un altro in base alla qualità delle ipotesi, ma per ora è sufficiente osservare che sono diversi.
In questo esercizio confronterai i risultati dei due modelli sul dataset pokemon per vedere come differiscono.
Questo esercizio fa parte del corso
Unsupervised Learning in R
Istruzioni dell'esercizio
I risultati del k-means eseguito sui dati pokemon (con 3 cluster) sono memorizzati in km.pokemon. Il modello di clustering gerarchico che hai creato nell’esercizio precedente è ancora disponibile come hclust.pokemon.
- Usando
cutree()suhclust.pokemon, assegna l’appartenenza al cluster a ciascuna osservazione. Supponi tre cluster e assegna il risultato a un vettore chiamatocut.pokemon. - Usando
table(), confronta l’appartenenza ai cluster tra i due metodi di clustering. Ricorda che i diversi componenti degli oggetti modello di k-means sono accessibili con l’operatore$.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Apply cutree() to hclust.pokemon: cut.pokemon
# Compare methods
table(___, ___)