Confrontare kmeans() e hclust()

Confrontando k-means e il clustering gerarchico, vedrai che i due metodi producono appartenenze ai cluster diverse. Questo perché gli algoritmi fanno ipotesi differenti su come vengono generati i dati. In un corso più avanzato, potremmo scegliere un modello rispetto a un altro in base alla qualità delle ipotesi, ma per ora è sufficiente osservare che sono diversi.

In questo esercizio confronterai i risultati dei due modelli sul dataset pokemon per vedere come differiscono.

Questo esercizio fa parte del corso

Unsupervised Learning in R

Visualizza corso

Istruzioni dell'esercizio

I risultati del k-means eseguito sui dati pokemon (con 3 cluster) sono memorizzati in km.pokemon. Il modello di clustering gerarchico che hai creato nell’esercizio precedente è ancora disponibile come hclust.pokemon.

Usando cutree() su hclust.pokemon, assegna l’appartenenza al cluster a ciascuna osservazione. Supponi tre cluster e assegna il risultato a un vettore chiamato cut.pokemon.
Usando table(), confronta l’appartenenza ai cluster tra i due metodi di clustering. Ricorda che i diversi componenti degli oggetti modello di k-means sono accessibili con l’operatore $.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Apply cutree() to hclust.pokemon: cut.pokemon


# Compare methods
table(___, ___)

Modifica ed esegui il codice