Primeros pasos
En este ejercicio, vas a echar un vistazo rápido a datos de ejemplo usando operaciones básicas de DataFrame y a dar una primera mirada al CTR. Los datos provienen de Avazu, una plataforma publicitaria global líder, y recogen interacciones de usuarios en varios tipos de dispositivos para diferentes sitios web y apps.
La variable objetivo estará en la columna click. La hora está en formato YYMMDDHH, y hay algunas columnas enteras: device_type para el tipo de dispositivo, banner_pos para la posición de un banner (también llamado display), etc. También habrá otras variables que se tratarán en capítulos posteriores.
Los datos de ejemplo en forma de DataFrame se cargan como df. pandas como pd están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Predicción del CTR con Machine Learning en Python
Instrucciones del ejercicio
- Define la variable
Xusando.isin().Xserán todas las columnas excepto la columnaclick. - Define la variable
y, a la que puedes acceder condf.click. - Imprime la proporción de filas de
yque son1—esto representa el CTR de la muestra— usandoy.sum().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))