Graphiques d’EDA II
Autre idée : le prix d’une course peut varier au cours de la journée.
Votre objectif est de tracer le tarif médian pour chaque heure de la journée sous forme de courbe simple. La caractéristique hour est déjà calculée pour vous. Ne vous inquiétez pas si vous ne savez pas encore manipuler les variables de date. Nous les aborderons dans le chapitre sur le Feature Engineering.
Cet exercice fait partie du cours
Gagner une compétition Kaggle en Python
Instructions
- Regroupez le DataFrame
trainpar"hour"et calculez la médiane pour la colonne"fare_amount". - À partir du DataFrame
hour_priceobtenu, tracez une courbe avec"hour"sur l’axe des x et"fare_amount"sur l’axe des y.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour
# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()
# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()