EDA-Plots II
Eine weitere Idee ist, dass sich der Preis einer Fahrt im Laufe des Tages ändern könnte.
Dein Ziel ist es, den Median des Fahrpreises für jede Stunde des Tages als einfachen Liniendiagramm-Plot darzustellen. Das Merkmal hour ist bereits für dich berechnet. Mach dir keine Sorgen, wenn du noch nicht weißt, wie man mit Datumsmerkmalen arbeitet. Wir schauen uns das im Kapitel zur Feature Engineering genauer an.
Diese Übung ist Teil des Kurses
Eine Kaggle-Competition in Python gewinnen
Anleitung zur Übung
- Gruppiere das DataFrame
trainnach"hour"und berechne den Median für die Spalte"fare_amount". - Erstelle mit dem resultierenden DataFrame
hour_priceeine Linie mit"hour"auf der x-Achse und"fare_amount"auf der y-Achse.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour
# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()
# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()