Normalización logarítmica
Estandarizar es importante para asegurarte de que todas las variables sean comparables. La normalización logarítmica es un método común de estandarización. Vas a comprobar la varianza de ciertas variables y calcular la mediana de la varianza entre todas ellas. Las variables serán las numéricas, excepto la columna click, banner_pos, device_type y las columnas search_engine_type, product_type, advertiser_type de la lección anterior, ya que en realidad son columnas categóricas. Luego aplicarás la normalización logarítmica a aquellas columnas con una varianza superior a la mediana y comprobarás los resultados.
El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de muestra está cargado como df.
Este ejercicio forma parte del curso
Predicción del CTR con Machine Learning en Python
ejercicio interactivo práctico
Prueba este ejercicio completando este código de ejemplo.
# Select numeric columns and print variance
num_df = df.____(include=['int', 'float'])
filter_cols = ['click', 'banner_pos', 'device_type',
'search_engine_type', 'product_type', 'advertiser_type']
new_df = num_df[num_df.columns[~num_df.columns.____(filter_cols)]]
median = new_df.____.____
print(median)