Numerische Features aggregieren
Ein gutes Einsatzszenario für eine aggregierte Kennzahl als neues Feature ist, wenn du viele Features mit ähnlichen, zusammenhängenden Werten hast. Hier hast du ein DataFrame mit Laufzeiten namens running_times_5k. Berechne für jeden name im Datensatz den Mittelwert seiner 5 Laufzeiten.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Verwende die Methode
.loc[], um alle Zeilen und die relevanten Spalten auszuwählen, und berechne mit.mean()den Mittelwert je Spalte. - Gib die
.head()des DataFrames aus, um die Spaltemeanzu sehen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)