ComeçarComece de graça

Analisando colunas de datetime

A engenharia de atributos é uma etapa importante em todo fluxo de trabalho de Machine Learning para processar atributos de diferentes tipos de dados. Em especial, colunas de datetime são comuns em muitos conjuntos de dados. Neste exercício, você vai explorar a coluna hour do conjunto de dados, que está armazenada como um inteiro, mas representa um datetime. Primeiro, você vai analisar a coluna hour para convertê-la em uma coluna datetime. Em seguida, vai extrair a hora do dia dessa coluna datetime e calcular o número total de cliques com base nessa hora do dia.

O módulo pandas está disponível como pd no seu ambiente e o DataFrame de amostra foi carregado como df.

Este exercício faz parte do curso

Prevendo CTR com Machine Learning em Python

Ver curso

Instruções do exercício

  • Converta a coluna hour de inteiro para uma coluna datetime usando pd.to_datetime().
  • Usando o acessor de datetime .dt, extraia o campo de hora da coluna convertida com .hour.
  • Calcule o total de cliques por hora extraída do dia usando .sum().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))

# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()
Editar e executar o código