Aan de slagGa gratis aan de slag

EDA-grafieken II

Een andere gedachte is dat de prijs van een rit in de loop van de dag kan veranderen.

Je doel is om het mediane ritbedrag per uur van de dag te plotten als een eenvoudige lijngrafiek. De uur-feature is al voor je berekend. Maak je geen zorgen als je nog niet weet hoe je met datumfeatures werkt. We gaan die verkennen in het hoofdstuk over Feature Engineering.

Deze oefening maakt deel uit van de cursus

Een Kaggle-competitie winnen met Python

Cursus bekijken

Oefeninstructies

  • Groepeer de DataFrame train op "hour" en bereken de mediaan voor de kolom "fare_amount".
  • Gebruik de verkregen DataFrame hour_price om een lijn te plotten met "hour" op de x-as en "fare_amount" op de y-as.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour

# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()

# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()
Code bewerken en uitvoeren