Aan de slagBegin gratis

Je gegevens standaardiseren

In het college zagen we dat je veel kunt leren over een gegevensset door de matrix \(A^TA\) ervan te maken. In deze oefening doe je dat met atletiekdata van spelers die meedoen aan de National Football League college draft. De gegevensset combine is voor je geladen.

Deze oefening maakt deel uit van de cursus

Lineaire algebra voor data science in R

Bekijk cursus

Oefeninstructies

  • Haal alleen de numerieke elementen uit het data frame door alleen de 5e t/m de 12e kolom te nemen. Noem dit A (we kunnen geen wiskunde doen op de niet-numerieke onderdelen in kolommen 1 t/m 4).
  • Zet dit data frame om in een matrix met de opdracht as.matrix().
  • Trek het gemiddelde van elke kolom van de matrix af.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Extract columns 5-12 of combine
A <- combine[, ___:___]

# Make A into a matrix
A <- ___(A)

# Subtract the mean of each column
A[, ___] <- A[, 1] - mean(A[, 1])
A[, 2] <- A[, 2] - ___(A[, 2])
A[, ___] <- A[, 3] - mean(A[, 3])
A[, ___] <- A[, ___] - mean(A[, 4])
A[, 5] <- A[, 5] - mean(A[, 5])
A[, ___] <- A[, 6] - mean(A[, ___])
A[, 7] <- A[, ___] - mean(A[, 7])
A[, ___] <- A[, 8] - mean(A[, 8])
Code bewerken en uitvoeren