ComenzarEmpieza gratis

Primeros pasos

En este ejercicio, vas a echar un vistazo rápido a datos de ejemplo usando operaciones básicas de DataFrame y a dar una primera mirada al CTR. Los datos provienen de Avazu, una plataforma publicitaria global líder, y recogen interacciones de usuarios en varios tipos de dispositivos para diferentes sitios web y apps.

La variable objetivo estará en la columna click. La hora está en formato YYMMDDHH, y hay algunas columnas enteras: device_type para el tipo de dispositivo, banner_pos para la posición de un banner (también llamado display), etc. También habrá otras variables que se tratarán en capítulos posteriores.

Los datos de ejemplo en forma de DataFrame se cargan como df. pandas como pd están disponibles en tu espacio de trabajo.

Este ejercicio forma parte del curso

Predicción del CTR con Machine Learning en Python

Ver curso

Instrucciones del ejercicio

  • Define la variable X usando .isin(). X serán todas las columnas excepto la columna click.
  • Define la variable y, a la que puedes acceder con df.click.
  • Imprime la proporción de filas de y que son 1 —esto representa el CTR de la muestra— usando y.sum().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Look at basics of Dataframe 
print(df.head(5))
print(df.columns)

# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____

# Sample CTR
print("Sample CTR :\n", 
      y.____/len(y))
Editar y ejecutar código