CommencerCommencer gratuitement

Combiner groupby() et resample()

Une méthode très puissante dans Pandas est .groupby(). Alors que .resample() regroupe les lignes en fonction d'informations relatives à l'heure ou à la date, .groupby() regroupe les lignes en fonction des valeurs d'une ou de plusieurs colonnes. Par exemple, rides.groupby('Member type').size() nous indiquerait le nombre de trajets par type de membre dans l'ensemble de notre DataFrame.

.resample() peut être appelé après .groupby(). Par exemple, quelle est la durée médiane du trajet par mois et par type d'adhérent ?

Cet exercice fait partie du cours

Travailler avec des dates et des heures en Python

Afficher le cours

Instructions

  • Complétez l'appel .groupby() pour regrouper par 'Member type', et l'appel .resample() pour rééchantillonner selon 'Start date', par mois.
  • Imprimez la médiane Duration pour chaque groupe.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Group rides by member type, and resample to the month
grouped = rides.groupby('____')\
  .resample(____, ____)

# Print the median duration for each group
print(grouped[____].____)
Modifier et exécuter le code