LoslegenKostenlos starten

EDA-Plots II

Eine weitere Idee ist, dass sich der Preis einer Fahrt im Laufe des Tages ändern könnte.

Dein Ziel ist es, den Median des Fahrpreises für jede Stunde des Tages als einfachen Liniendiagramm-Plot darzustellen. Das Merkmal hour ist bereits für dich berechnet. Mach dir keine Sorgen, wenn du noch nicht weißt, wie man mit Datumsmerkmalen arbeitet. Wir schauen uns das im Kapitel zur Feature Engineering genauer an.

Diese Übung ist Teil des Kurses

<Kurs>Eine Kaggle-Competition in Python gewinnen</Kurs>
Kurs ansehen

Übungsanweisungen

  • Gruppiere das DataFrame train nach "hour" und berechne den Median für die Spalte "fare_amount".
  • Erstelle mit dem resultierenden DataFrame hour_price eine Linie mit "hour" auf der x-Achse und "fare_amount" auf der y-Achse.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour

# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()

# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()
Code bearbeiten und ausführen