Agrégation de variables numériques
Calculer une statistique agrégée pour créer une nouvelle variable est utile lorsque vous avez de nombreuses variables aux valeurs proches ou liées. Ici, vous disposez d’un DataFrame de temps de course nommé running_times_5k. Pour chaque name du jeu de données, calculez la moyenne de ses 5 temps de course.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Utilisez la méthode
.loc[]pour sélectionner toutes les lignes et les colonnes afin de trouver la.mean()de chaque colonne. - Affichez le
.head()du DataFrame pour voir la colonnemean.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)