LoslegenKostenlos loslegen

EDA-Plots II

Eine weitere Idee ist, dass sich der Preis einer Fahrt im Laufe des Tages ändern könnte.

Dein Ziel ist es, den Median des Fahrpreises für jede Stunde des Tages als einfachen Liniendiagramm-Plot darzustellen. Das Merkmal hour ist bereits für dich berechnet. Mach dir keine Sorgen, wenn du noch nicht weißt, wie man mit Datumsmerkmalen arbeitet. Wir schauen uns das im Kapitel zur Feature Engineering genauer an.

Diese Übung ist Teil des Kurses

Eine Kaggle-Competition in Python gewinnen

Kurs anzeigen

Anleitung zur Übung

  • Gruppiere das DataFrame train nach "hour" und berechne den Median für die Spalte "fare_amount".
  • Erstelle mit dem resultierenden DataFrame hour_price eine Linie mit "hour" auf der x-Achse und "fare_amount" auf der y-Achse.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour

# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()

# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()
Code bearbeiten und ausführen