Normalización logarítmica
Estandarizar es importante para asegurarte de que todas las variables sean comparables. La normalización logarítmica es un método común de estandarización. Vas a comprobar la varianza de ciertas variables y calcular la mediana de la varianza entre todas ellas. Las variables serán las numéricas, excepto la columna click, banner_pos, device_type y las columnas search_engine_type, product_type, advertiser_type de la lección anterior, ya que en realidad son columnas categóricas. Luego aplicarás la normalización logarítmica a aquellas columnas con una varianza superior a la mediana y comprobarás los resultados.
El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de muestra está cargado como df.
Este ejercicio forma parte del curso
Predicción del CTR con Machine Learning en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Select numeric columns and print variance
num_df = df.____(include=['int', 'float'])
filter_cols = ['click', 'banner_pos', 'device_type',
'search_engine_type', 'product_type', 'advertiser_type']
new_df = num_df[num_df.columns[~num_df.columns.____(filter_cols)]]
median = new_df.____.____
print(median)