Combiner groupby() et resample()
Une méthode très puissante dans Pandas est .groupby()
. Alors que .resample()
regroupe les lignes en fonction d'informations relatives à l'heure ou à la date, .groupby()
regroupe les lignes en fonction des valeurs d'une ou de plusieurs colonnes. Par exemple, rides.groupby('Member type').size()
nous indiquerait le nombre de trajets par type de membre dans l'ensemble de notre DataFrame.
.resample()
peut être appelé après .groupby()
. Par exemple, quelle est la durée médiane du trajet par mois et par type d'adhérent ?
Cet exercice fait partie du cours
Travailler avec des dates et des heures en Python
Instructions
- Complétez l'appel
.groupby()
pour regrouper par'Member type'
, et l'appel.resample()
pour rééchantillonner selon'Start date'
, par mois. - Imprimez la médiane
Duration
pour chaque groupe.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Group rides by member type, and resample to the month
grouped = rides.groupby('____')\
.resample(____, ____)
# Print the median duration for each group
print(grouped[____].____)