EmpezarEmpieza gratis

Normalización logarítmica

Estandarizar es importante para asegurarte de que todas las variables sean comparables. La normalización logarítmica es un método común de estandarización. Vas a comprobar la varianza de ciertas variables y calcular la mediana de la varianza entre todas ellas. Las variables serán las numéricas, excepto la columna click, banner_pos, device_type y las columnas search_engine_type, product_type, advertiser_type de la lección anterior, ya que en realidad son columnas categóricas. Luego aplicarás la normalización logarítmica a aquellas columnas con una varianza superior a la mediana y comprobarás los resultados.

El módulo pandas está disponible como pd en tu espacio de trabajo y el DataFrame de muestra está cargado como df.

Este ejercicio forma parte del curso

Predicción del CTR con Machine Learning en Python

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Select numeric columns and print variance
num_df = df.____(include=['int', 'float'])
filter_cols = ['click', 'banner_pos', 'device_type',
               'search_engine_type', 'product_type', 'advertiser_type']
new_df = num_df[num_df.columns[~num_df.columns.____(filter_cols)]]
median = new_df.____.____
print(median)
Editar y ejecutar código