Combiner groupby() et resample()
Une méthode particulièrement efficace dans Pandas est .groupby(). Alors que .resample() regroupe les lignes en fonction d'informations relatives à l'heure ou à la date, .groupby() regroupe les lignes en fonction des valeurs contenues dans une ou plusieurs colonnes. Par exemple, rides.groupby('Member type').size() nous indiquerait le nombre de trajets par type de membre dans l'ensemble de notre DataFrame.
.resample() peut être appelé après l'.groupby(). Par exemple, quelle était la durée médiane des trajets par mois et par type d'abonnement ?
Cet exercice fait partie du cours
Utilisation des dates et des heures en Python
Instructions
- Veuillez compléter l'appel à l'
.groupby()pour regrouper par'Member type'et l'appel à l'.resample()pour rééchantillonner selon'Start date', par mois. - Veuillez imprimer l'
Durationmédiane pour chaque groupe.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Group rides by member type, and resample to the month
grouped = rides.groupby('____')\
.resample('____', on = '____')
# Print the median duration for each group
print(grouped[____].____)