Je gegevens standaardiseren
In het college zagen we dat je veel kunt leren over een gegevensset door de matrix \(A^TA\) ervan te maken. In deze oefening doe je dat met atletiekdata van spelers die meedoen aan de National Football League college draft. De gegevensset combine is voor je geladen.
Deze oefening maakt deel uit van de cursus
Lineaire algebra voor data science in R
Oefeninstructies
- Haal alleen de numerieke elementen uit het data frame door alleen de 5e t/m de 12e kolom te nemen. Noem dit
A(we kunnen geen wiskunde doen op de niet-numerieke onderdelen in kolommen 1 t/m 4). - Zet dit data frame om in een matrix met de opdracht
as.matrix(). - Trek het gemiddelde van elke kolom van de matrix af.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Extract columns 5-12 of combine
A <- combine[, ___:___]
# Make A into a matrix
A <- ___(A)
# Subtract the mean of each column
A[, ___] <- A[, 1] - mean(A[, 1])
A[, 2] <- A[, 2] - ___(A[, 2])
A[, ___] <- A[, 3] - mean(A[, 3])
A[, ___] <- A[, ___] - mean(A[, 4])
A[, 5] <- A[, 5] - mean(A[, 5])
A[, ___] <- A[, 6] - mean(A[, ___])
A[, 7] <- A[, ___] - mean(A[, 7])
A[, ___] <- A[, 8] - mean(A[, 8])