1. Apprendre
  2. /
  3. Cours
  4. /
  5. Prétraitement pour le Machine Learning en Python

Connected

Exercice

Agrégation de caractéristiques numériques

Un bon cas d'utilisation des statistiques d'agrégation pour créer une nouvelle caractéristique survient lorsque vous avez de nombreuses caractéristiques aux valeurs semblables et liées. Ici, vous avez un DataFrame des temps de course nommé running_times_5k. Pour chaque name dans l'ensemble de données, calculez la moyenne de ses 5 temps de course.

Instructions

100 XP
  • Utilisez la méthode .loc[] pour sélectionner toutes les lignes et colonnes afin de calculer la .mean() de chaque colonne.
  • Affichez le .head() du DataFrame pour voir la colonne mean.