Gráficas de EDA II
Otra idea que se nos puede ocurrir es que el precio de un viaje cambie a lo largo del día.
Tu objetivo es representar en una gráfica de líneas simple la tarifa mediana para cada hora del día. La característica de la hora ya está calculada por ti. No te preocupes si aún no sabes trabajar con variables de fecha; lo veremos en el capítulo de Feature Engineering.
Este ejercicio forma parte del curso
Cómo ganar una competición de Kaggle con Python
Instrucciones del ejercicio
- Agrupa el DataFrame
trainpor"hour"y calcula la mediana de la columna"fare_amount". - Con el DataFrame
hour_priceobtenido, traza una línea con"hour"en el eje x y"fare_amount"en el eje y.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour
# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()
# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()