LoslegenKostenlos loslegen

Kombinieren von groupby() und resample()

Eine echt mächtige Funktion in Pandas ist „ .groupby() “. Während „ .resample() “ die Zeilen nach Zeit- oder Datumsinfos sortiert, gruppiert „ .groupby() “ die Zeilen nach den Werten in einer oder mehreren Spalten. Zum Beispiel würde uns „ rides.groupby('Member type').size() “ zeigen, wie viele Fahrten es pro Mitgliedstyp in unserem ganzen DataFrame gab.

.resample() kann nach „ .groupby() “ aufgerufen werden. Wie lang war zum Beispiel die durchschnittliche Fahrt pro Monat und je nach Mitgliedschaftstyp?

Diese Übung ist Teil des Kurses

Arbeiten mit Datums- und Zeitangaben in Python

Kurs anzeigen

Anleitung zur Übung

  • Mach den Aufruf „ .groupby() “ fertig, um nach Gruppen zu sortieren, wie unter 'Member type' beschrieben, und den Aufruf „ .resample() “, um nach Monaten neu zu berechnen, wie unter 'Start date' beschrieben.
  • Druck die Median Duration en für jede Gruppe aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Group rides by member type, and resample to the month
grouped = rides.groupby('____')\
  .resample('____', on = '____')

# Print the median duration for each group
print(grouped[____].____)
Code bearbeiten und ausführen