Clustering k-means e confronto dei risultati

Come ormai sai, esistono due tipi principali di clustering: gerarchico e k-means.

In questo esercizio creerai un modello di clustering k-means sui dati del Wisconsin sul tumore al seno e confronterai i risultati sia con le diagnosi reali sia con quelli del tuo modello di clustering gerarchico. Prenditi un momento per capire come ciascun modello di clustering si comporta nel separare le due diagnosi e come i modelli si confrontano tra loro.

Questo esercizio fa parte del corso

Unsupervised Learning in R

Visualizza corso

Istruzioni dell'esercizio

wisc.data, diagnosis e wisc.hclust.clusters sono ancora disponibili.

Crea un modello k-means su wisc.data, assegnando il risultato a wisc.km. Assicurati di creare 2 cluster, corrispondenti al numero reale di diagnosi. Ricorda anche di scalare i dati e ripetere l'algoritmo 20 volte per trovare un modello con buone prestazioni.
Usa la funzione table() per confrontare l'appartenenza ai cluster del modello k-means con le diagnosi reali contenute nel vettore diagnosis. Quanto bene k-means separa le due diagnosi?
Usa la funzione table() per confrontare l'appartenenza ai cluster del modello k-means con il modello di clustering gerarchico. Ricorda che l'appartenenza ai cluster del modello gerarchico è contenuta in wisc.hclust.clusters.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a k-means model on wisc.data: wisc.km


# Compare k-means to actual diagnoses


# Compare k-means to hierarchical clustering

Modifica ed esegui il codice