Aan de slagGa gratis aan de slag

Je gegevens standaardiseren

In het college zagen we dat je veel kunt leren over een gegevensset door de matrix \(A^TA\) ervan te maken. In deze oefening doe je dat met atletiekdata van spelers die meedoen aan de National Football League college draft. De gegevensset combine is voor je geladen.

Deze oefening maakt deel uit van de cursus

Lineaire algebra voor data science in R

Cursus bekijken

Oefeninstructies

  • Haal alleen de numerieke elementen uit het data frame door alleen de 5e t/m de 12e kolom te nemen. Noem dit A (we kunnen geen wiskunde doen op de niet-numerieke onderdelen in kolommen 1 t/m 4).
  • Zet dit data frame om in een matrix met de opdracht as.matrix().
  • Trek het gemiddelde van elke kolom van de matrix af.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extract columns 5-12 of combine
A <- combine[, ___:___]

# Make A into a matrix
A <- ___(A)

# Subtract the mean of each column
A[, ___] <- A[, 1] - mean(A[, 1])
A[, 2] <- A[, 2] - ___(A[, 2])
A[, ___] <- A[, 3] - mean(A[, 3])
A[, ___] <- A[, ___] - mean(A[, 4])
A[, 5] <- A[, 5] - mean(A[, 5])
A[, ___] <- A[, 6] - mean(A[, ___])
A[, 7] <- A[, ___] - mean(A[, 7])
A[, ___] <- A[, 8] - mean(A[, 8])
Code bewerken en uitvoeren