Deine Daten standardisieren
In der Vorlesung haben wir gesehen, dass du viel über einen Datensatz lernen kannst, indem du die Matrix \(A^TA\) daraus bildest. In dieser Übung machst du das mit sportlichen Leistungsdaten von Spieler:innen, die sich für den College-Draft der National Football League anmelden. Der Datensatz combine ist bereits geladen.
Diese Übung ist Teil des Kurses
Lineare Algebra für Data Science in R
Anleitung zur Übung
- Extrahiere nur die numerischen Elemente des Dataframes, indem du nur die 5. bis 12. Spalte nimmst. Nenne das Ergebnis
A(mit den nichtnumerischen Komponenten in den Spalten 1 bis 4 können wir nicht rechnen). - Wandle dieses Dataframe mit dem Befehl
as.matrix()in eine Matrix um. - Subtrahiere den Mittelwert jeder Spalte der Matrix.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Extract columns 5-12 of combine
A <- combine[, ___:___]
# Make A into a matrix
A <- ___(A)
# Subtract the mean of each column
A[, ___] <- A[, 1] - mean(A[, 1])
A[, 2] <- A[, 2] - ___(A[, 2])
A[, ___] <- A[, 3] - mean(A[, 3])
A[, ___] <- A[, ___] - mean(A[, 4])
A[, 5] <- A[, 5] - mean(A[, 5])
A[, ___] <- A[, 6] - mean(A[, ___])
A[, 7] <- A[, ___] - mean(A[, 7])
A[, ___] <- A[, 8] - mean(A[, 8])