IniziaInizia gratis

Riepilogare la PCA in R

Come visto nel video, c’era una variabile categorica (position) nei nostri dati che sembrava corrispondere a dei cluster nei primi due componenti principali. Anche scalando i dati, questi due PC spiegano ancora gran parte della variabilità. E se considerassimo una sola posizione alla volta?

Questo esercizio fa parte del corso

Algebra lineare per la Data Science in R

Visualizza il corso

Istruzioni dell'esercizio

Esegui la stessa analisi del precedente esercizio, ma usa solo il sottoinsieme dei dati in cui position è uguale a "WR" (wide receiver):

  • Usa la funzione scale() per scalare dalla quinta alla dodicesima colonna dei dati combine_WR. Chiama questo data frame B e mostra alcuni valori con head().
  • Usa prcomp() per eseguire l’analisi delle componenti principali sui dati e riassumi l’analisi con summary().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")

# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
___(___)
Modifica ed esegui il codice