ComeçarComece de graça

Gráficos de EDA II

Outra ideia que vem à mente é que o preço de uma corrida pode variar ao longo do dia.

Seu objetivo é traçar a mediana do valor da tarifa para cada hora do dia em um gráfico de linha simples. A variável de hora já foi calculada para você. Não se preocupe se você ainda não souber trabalhar com recursos de data. Vamos explorá-los no capítulo de Engenharia de Atributos.

Este exercício faz parte do curso

Vencendo uma competição do Kaggle em Python

Ver curso

Instruções do exercício

  • Agrupe o DataFrame train por "hour" e calcule a mediana da coluna "fare_amount".
  • Usando o DataFrame hour_price obtido, plote uma linha com "hour" no eixo x e "fare_amount" no eixo y.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create hour feature
train['pickup_datetime'] = pd.to_datetime(train.pickup_datetime)
train['hour'] = train.pickup_datetime.dt.hour

# Find median fare_amount for each hour
hour_price = train.____('____', as_index=False)['____'].____()

# Plot the line plot
plt.plot(hour_price[____], hour_price[____], marker='o')
plt.xlabel('Hour of the day')
plt.ylabel('Median fare amount')
plt.title('Fare amount based on day time')
plt.xticks(range(24))
plt.show()
Editar e executar o código