ComenzarEmpieza gratis

Gráficas de EDA II

Otra idea que se nos puede ocurrir es que el precio de un viaje cambie a lo largo del día.

Tu objetivo es representar en una gráfica de líneas simple la tarifa mediana para cada hora del día. La característica de la hora ya está calculada por ti. No te preocupes si aún no sabes trabajar con variables de fecha; lo veremos en el capítulo de Feature Engineering.

Este ejercicio forma parte del curso

Cómo ganar una competición de Kaggle con Python

Ver curso

Instrucciones del ejercicio

  • Agrupa el DataFrame train por "hour" y calcula la mediana de la columna "fare_amount".
  • Con el DataFrame hour_price obtenido, traza una línea con "hour" en el eje x y "fare_amount" en el eje y.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour

# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()

# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()
Editar y ejecutar código