Grafici di EDA II
Un'altra idea che viene in mente è che il prezzo di una corsa possa cambiare durante la giornata.
Il tuo obiettivo è tracciare la tariffa mediana per ogni ora del giorno con un semplice grafico a linee. La feature hour è già stata calcolata per te. Non preoccuparti se non sai ancora lavorare con le feature temporali: le vedremo nel capitolo sulla Feature Engineering.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
Istruzioni dell'esercizio
- Raggruppa il DataFrame
trainper"hour"e calcola la mediana per la colonna"fare_amount". - Usando il DataFrame
hour_priceottenuto, traccia una linea con"hour"sull'asse x e"fare_amount"sull'asse y.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour
# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()
# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()