CommencerCommencez gratuitement

Agrégation de variables numériques

Calculer une statistique agrégée pour créer une nouvelle variable est utile lorsque vous avez de nombreuses variables aux valeurs proches ou liées. Ici, vous disposez d’un DataFrame de temps de course nommé running_times_5k. Pour chaque name du jeu de données, calculez la moyenne de ses 5 temps de course.

Cet exercice fait partie du cours

<cours>Prétraitement pour le Machine Learning en Python</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez la méthode .loc[] pour sélectionner toutes les lignes et les colonnes afin de trouver la .mean() de chaque colonne.
  • Affichez le .head() du DataFrame pour voir la colonne mean.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)

# Take a look at the results
print(____)
Modifier et exécuter le code