CommencerCommencer gratuitement

Graphiques d’EDA II

Autre idée : le prix d’une course peut varier au cours de la journée.

Votre objectif est de tracer le tarif médian pour chaque heure de la journée sous forme de courbe simple. La caractéristique hour est déjà calculée pour vous. Ne vous inquiétez pas si vous ne savez pas encore manipuler les variables de date. Nous les aborderons dans le chapitre sur le Feature Engineering.

Cet exercice fait partie du cours

Gagner une compétition Kaggle en Python

Afficher le cours

Instructions

  • Regroupez le DataFrame train par "hour" et calculez la médiane pour la colonne "fare_amount".
  • À partir du DataFrame hour_price obtenu, tracez une courbe avec "hour" sur l’axe des x et "fare_amount" sur l’axe des y.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour

# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()

# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()
Modifier et exécuter le code