Scalare i dati prima della PCA
Quando lavori con dati che hanno caratteristiche su scale diverse, è spesso importante scalare prima i dati. Questo perché variabili con valori più grandi possono influenzare l'analisi anche con una variabilità relativamente bassa.
Il data frame combine è già caricato per te.
Questo esercizio fa parte del corso
Algebra lineare per la Data Science in R
Istruzioni dell'esercizio
- Usa la funzione
scale()per scalare le colonne dalla 5 alla 12 dei daticombine. Assegna il risultato al data frameBe mostra alcuni valori conhead(). - Usa
prcomp()per eseguire la Principal Component Analysis sui dati e riassumi l'analisi consummary().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))