IniziaInizia gratis

Grafici di EDA II

Un'altra idea che viene in mente è che il prezzo di una corsa possa cambiare durante la giornata.

Il tuo obiettivo è tracciare la tariffa mediana per ogni ora del giorno con un semplice grafico a linee. La feature hour è già stata calcolata per te. Non preoccuparti se non sai ancora lavorare con le feature temporali: le vedremo nel capitolo sulla Feature Engineering.

Questo esercizio fa parte del corso

Vincere una competizione Kaggle con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Raggruppa il DataFrame train per "hour" e calcola la mediana per la colonna "fare_amount".
  • Usando il DataFrame hour_price ottenuto, traccia una linea con "hour" sull'asse x e "fare_amount" sull'asse y.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour

# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()

# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()
Modifica ed esegui il codice