ComenzarEmpieza gratis

Normalización logarítmica

Estandarizar es importante para asegurarte de que todas las variables sean comparables. La normalización logarítmica es un método común de estandarización. Vas a comprobar la varianza de ciertas variables y calcular la mediana de la varianza entre todas ellas. Las variables serán las numéricas, excepto la columna click, banner_pos, device_type y las columnas search_engine_type, product_type, advertiser_type de la lección anterior, ya que en realidad son columnas categóricas. Luego aplicarás la normalización logarítmica a aquellas columnas con una varianza superior a la mediana y comprobarás los resultados.

El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de muestra está cargado como df.

Este ejercicio forma parte del curso

Predicción del CTR con Machine Learning en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Select numeric columns and print variance
num_df = df.____(include=['int', 'float'])
filter_cols = ['click', 'banner_pos', 'device_type',
               'search_engine_type', 'product_type', 'advertiser_type']
new_df = num_df[num_df.columns[~num_df.columns.____(filter_cols)]]
median = new_df.____.____
print(median)
Editar y ejecutar código