ComenzarEmpieza gratis

Analizar columnas de tipo datetime

La ingeniería de características es un paso importante en cualquier flujo de trabajo de Machine Learning para procesar variables de distintos tipos de datos. En particular, las columnas de tipo datetime son habituales en muchos conjuntos de datos. En este ejercicio, explorarás la columna hour del conjunto de datos, que está almacenada como un entero pero representa un datetime. Primero, analizarás (parsearás) la columna hour para convertirla en una columna datetime. Después, extraerás la hora del día de esa columna datetime y calcularás el número total de clics en función de esa hora del día.

El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de ejemplo está cargado como df.

Este ejercicio forma parte del curso

Predicción del CTR con Machine Learning en Python

Ver curso

Instrucciones del ejercicio

  • Convierte la columna hour de entero a una columna datetime usando pd.to_datetime().
  • Usando el accesor de datetime .dt, extrae el campo de hora de la columna convertida con .hour.
  • Calcula los clics totales por la hora del día extraída usando .sum().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))

# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()
Editar y ejecutar código