Standardizzare i tuoi dati
Nella lezione abbiamo visto che puoi imparare molto su un insieme di dati creando la matrice \(A^TA\) a partire da esso. In questo esercizio lo farai con i dati atletici dei giocatori che partecipano al college draft della National Football League. Il dataset combine è già caricato per te.
Questo esercizio fa parte del corso
Algebra lineare per la Data Science in R
Istruzioni dell'esercizio
- Estrai solo gli elementi numerici del data frame prendendo esclusivamente le colonne dalla 5 alla 12. Chiama questo
A(non possiamo fare calcoli sui componenti non numerici nelle colonne da 1 a 4). - Trasforma questo data frame in una matrice usando il comando
as.matrix(). - Sottrai la media di ciascuna colonna della matrice.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Extract columns 5-12 of combine
A <- combine[, ___:___]
# Make A into a matrix
A <- ___(A)
# Subtract the mean of each column
A[, ___] <- A[, 1] - mean(A[, 1])
A[, 2] <- A[, 2] - ___(A[, 2])
A[, ___] <- A[, 3] - mean(A[, 3])
A[, ___] <- A[, ___] - mean(A[, 4])
A[, 5] <- A[, 5] - mean(A[, 5])
A[, ___] <- A[, 6] - mean(A[, ___])
A[, 7] <- A[, ___] - mean(A[, 7])
A[, ___] <- A[, 8] - mean(A[, 8])