Plot EDA II
Gagasan lain yang muncul adalah bahwa harga sebuah perjalanan dapat berubah sepanjang hari.
Tujuan Anda adalah membuat plot garis sederhana dari median nilai tarif untuk setiap jam dalam sehari. Fitur jam sudah dihitung untuk Anda. Jangan khawatir jika Anda belum tahu cara bekerja dengan fitur tanggal. Kita akan membahasnya di bab tentang Feature Engineering.
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Petunjuk latihan
- Kelompokkan DataFrame
trainberdasarkan"hour"dan hitung median untuk kolom"fare_amount". - Menggunakan DataFrame
hour_priceyang diperoleh, buat plot garis dengan"hour"pada sumbu x dan"fare_amount"pada sumbu y.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour
# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()
# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()