Numerieke features aggregeren
Een goed gebruik van een aggregatiestatistiek om een nieuwe feature te maken is wanneer je veel features met vergelijkbare, gerelateerde waarden hebt. Hier heb je een DataFrame met looptijden genaamd running_times_5k. Neem voor elke name in de gegevensset het gemiddelde van hun 5 looptijden.
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Gebruik de methode
.loc[]om alle rijen en kolommen te selecteren en het.mean()van elke kolom te bepalen. - Print de
.head()van de DataFrame om de kolommeante bekijken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)