Interpretare i risultati della PCA

Ora userai alcune visualizzazioni per capire meglio il tuo modello di PCA. Una di queste, il biplot, è stata introdotta in un capitolo precedente.

Ti imbatterai in alcune difficoltà tipiche nell’uso dei biplot su dati reali con un numero non banale di osservazioni e variabili, poi esaminerai visualizzazioni alternative. Ti consigliamo di sperimentare ulteriori visualizzazioni prima di passare al prossimo esercizio.

Questo esercizio fa parte del corso

Unsupervised Learning in R

Visualizza corso

Istruzioni dell'esercizio

Le variabili che hai creato in precedenza, wisc.data, diagnosis e wisc.pr, sono ancora disponibili.

Crea un biplot dei dati wisc.pr. Cosa ti colpisce di questo grafico? È facile o difficile da interpretare? Perché?
Esegui il codice per creare uno scatter plot di ciascuna osservazione rispetto alle componenti principali 1 e 2, colorando i punti in base alla diagnosi.
Ripeti lo stesso per le componenti principali 1 e 3. Cosa noti in questi grafici?

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a biplot of wisc.pr


# Scatter plot observations by components 1 and 2
plot(wisc.pr$___[, c(1, 2)], col = (diagnosis + 1), 
     xlab = "PC1", ylab = "PC2")

# Repeat for components 1 and 3
plot(___, col = (diagnosis + 1), 
     xlab = "PC1", ylab = "PC3")

# Do additional data exploration of your choosing below (optional)

Modifica ed esegui il codice