Clustering k-means e confronto dei risultati
Come ormai sai, esistono due tipi principali di clustering: gerarchico e k-means.
In questo esercizio creerai un modello di clustering k-means sui dati del Wisconsin sul tumore al seno e confronterai i risultati sia con le diagnosi reali sia con quelli del tuo modello di clustering gerarchico. Prenditi un momento per capire come ciascun modello di clustering si comporta nel separare le due diagnosi e come i modelli si confrontano tra loro.
Questo esercizio fa parte del corso
Unsupervised Learning in R
Istruzioni dell'esercizio
wisc.data, diagnosis e wisc.hclust.clusters sono ancora disponibili.
- Crea un modello k-means su
wisc.data, assegnando il risultato awisc.km. Assicurati di creare 2 cluster, corrispondenti al numero reale di diagnosi. Ricorda anche di scalare i dati e ripetere l'algoritmo 20 volte per trovare un modello con buone prestazioni. - Usa la funzione
table()per confrontare l'appartenenza ai cluster del modello k-means con le diagnosi reali contenute nel vettorediagnosis. Quanto bene k-means separa le due diagnosi? - Usa la funzione
table()per confrontare l'appartenenza ai cluster del modello k-means con il modello di clustering gerarchico. Ricorda che l'appartenenza ai cluster del modello gerarchico è contenuta inwisc.hclust.clusters.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a k-means model on wisc.data: wisc.km
# Compare k-means to actual diagnoses
# Compare k-means to hierarchical clustering