Gráficos de EDA II
Outra ideia que vem à mente é que o preço de uma corrida pode variar ao longo do dia.
Seu objetivo é traçar a mediana do valor da tarifa para cada hora do dia em um gráfico de linha simples. A variável de hora já foi calculada para você. Não se preocupe se você ainda não souber trabalhar com recursos de data. Vamos explorá-los no capítulo de Engenharia de Atributos.
Este exercício faz parte do curso
Vencendo uma competição do Kaggle em Python
Instruções do exercício
- Agrupe o DataFrame
trainpor"hour"e calcule a mediana da coluna"fare_amount". - Usando o DataFrame
hour_priceobtido, plote uma linha com"hour"no eixo x e"fare_amount"no eixo y.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour
# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()
# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()