Interpretare i risultati della PCA
Ora userai alcune visualizzazioni per capire meglio il tuo modello di PCA. Una di queste, il biplot, è stata introdotta in un capitolo precedente.
Ti imbatterai in alcune difficoltà tipiche nell’uso dei biplot su dati reali con un numero non banale di osservazioni e variabili, poi esaminerai visualizzazioni alternative. Ti consigliamo di sperimentare ulteriori visualizzazioni prima di passare al prossimo esercizio.
Questo esercizio fa parte del corso
Unsupervised Learning in R
Istruzioni dell'esercizio
Le variabili che hai creato in precedenza, wisc.data, diagnosis e wisc.pr, sono ancora disponibili.
- Crea un biplot dei dati
wisc.pr. Cosa ti colpisce di questo grafico? È facile o difficile da interpretare? Perché? - Esegui il codice per creare uno scatter plot di ciascuna osservazione rispetto alle componenti principali 1 e 2, colorando i punti in base alla diagnosi.
- Ripeti lo stesso per le componenti principali 1 e 3. Cosa noti in questi grafici?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a biplot of wisc.pr
# Scatter plot observations by components 1 and 2
plot(wisc.pr$___[, c(1, 2)], col = (diagnosis + 1),
xlab = "PC1", ylab = "PC2")
# Repeat for components 1 and 3
plot(___, col = (diagnosis + 1),
xlab = "PC1", ylab = "PC3")
# Do additional data exploration of your choosing below (optional)