CommencerCommencer gratuitement

Agrégation de variables numériques

Calculer une statistique agrégée pour créer une nouvelle variable est utile lorsque vous avez de nombreuses variables aux valeurs proches ou liées. Ici, vous disposez d’un DataFrame de temps de course nommé running_times_5k. Pour chaque name du jeu de données, calculez la moyenne de ses 5 temps de course.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Utilisez la méthode .loc[] pour sélectionner toutes les lignes et les colonnes afin de trouver la .mean() de chaque colonne.
  • Affichez le .head() du DataFrame pour voir la colonne mean.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)

# Take a look at the results
print(____)
Modifier et exécuter le code