Kombinieren von groupby() und resample()
Eine echt mächtige Funktion in Pandas ist „ .groupby() “. Während „ .resample() “ die Zeilen nach Zeit- oder Datumsinfos sortiert, gruppiert „ .groupby() “ die Zeilen nach den Werten in einer oder mehreren Spalten. Zum Beispiel würde uns „ rides.groupby('Member type').size() “ zeigen, wie viele Fahrten es pro Mitgliedstyp in unserem ganzen DataFrame gab.
.resample() kann nach „ .groupby() “ aufgerufen werden. Wie lang war zum Beispiel die durchschnittliche Fahrt pro Monat und je nach Mitgliedschaftstyp?
Diese Übung ist Teil des Kurses
Arbeiten mit Datums- und Zeitangaben in Python
Anleitung zur Übung
- Mach den Aufruf „
.groupby()“ fertig, um nach Gruppen zu sortieren, wie unter'Member type'beschrieben, und den Aufruf „.resample()“, um nach Monaten neu zu berechnen, wie unter'Start date'beschrieben. - Druck die Median
Durationen für jede Gruppe aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Group rides by member type, and resample to the month
grouped = rides.groupby('____')\
.resample('____', on = '____')
# Print the median duration for each group
print(grouped[____].____)