Aan de slagGa gratis aan de slag

Numerieke features aggregeren

Een goed gebruik van een aggregatiestatistiek om een nieuwe feature te maken is wanneer je veel features met vergelijkbare, gerelateerde waarden hebt. Hier heb je een DataFrame met looptijden genaamd running_times_5k. Neem voor elke name in de gegevensset het gemiddelde van hun 5 looptijden.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Gebruik de methode .loc[] om alle rijen en kolommen te selecteren en het .mean() van elke kolom te bepalen.
  • Print de .head() van de DataFrame om de kolom mean te bekijken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)

# Take a look at the results
print(____)
Code bewerken en uitvoeren