Riepilogare la PCA in R
Come visto nel video, c’era una variabile categorica (position) nei nostri dati che sembrava corrispondere a dei cluster nei primi due componenti principali. Anche scalando i dati, questi due PC spiegano ancora gran parte della variabilità. E se considerassimo una sola posizione alla volta?
Questo esercizio fa parte del corso
Algebra lineare per la Data Science in R
Istruzioni dell'esercizio
Esegui la stessa analisi del precedente esercizio, ma usa solo il sottoinsieme dei dati in cui position è uguale a "WR" (wide receiver):
- Usa la funzione
scale()per scalare dalla quinta alla dodicesima colonna dei daticombine_WR. Chiama questo data frameBe mostra alcuni valori conhead(). - Usa
prcomp()per eseguire l’analisi delle componenti principali sui dati e riassumi l’analisi consummary().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")
# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
___(___)