EDA-Plots II
Eine weitere Idee ist, dass sich der Preis einer Fahrt im Laufe des Tages ändern könnte.
Dein Ziel ist es, den Median des Fahrpreises für jede Stunde des Tages als einfachen Liniendiagramm-Plot darzustellen. Das Merkmal hour ist bereits für dich berechnet. Mach dir keine Sorgen, wenn du noch nicht weißt, wie man mit Datumsmerkmalen arbeitet. Wir schauen uns das im Kapitel zur Feature Engineering genauer an.
Diese Übung ist Teil des Kurses
<Kurs>Eine Kaggle-Competition in Python gewinnen</Kurs>Übungsanweisungen
- Gruppiere das DataFrame
trainnach"hour"und berechne den Median für die Spalte"fare_amount". - Erstelle mit dem resultierenden DataFrame
hour_priceeine Linie mit"hour"auf der x-Achse und"fare_amount"auf der y-Achse.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour
# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()
# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()