Analisando colunas de datetime
A engenharia de atributos é uma etapa importante em todo fluxo de trabalho de Machine Learning para processar atributos de diferentes tipos de dados. Em especial, colunas de datetime são comuns em muitos conjuntos de dados. Neste exercício, você vai explorar a coluna hour do conjunto de dados, que está armazenada como um inteiro, mas representa um datetime. Primeiro, você vai analisar a coluna hour para convertê-la em uma coluna datetime. Em seguida, vai extrair a hora do dia dessa coluna datetime e calcular o número total de cliques com base nessa hora do dia.
O módulo pandas está disponível como pd no seu ambiente e o DataFrame de amostra foi carregado como df.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Converta a coluna
hourde inteiro para uma colunadatetimeusandopd.to_datetime(). - Usando o acessor de datetime
.dt, extraia o campo de hora da coluna convertida com.hour. - Calcule o total de cliques por hora extraída do dia usando
.sum().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))
# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()