ComenzarEmpieza gratis

Normaliza las variables

Ahora, el último paso de la preparación de datos. Vas a transformar el conjunto de datos sin asimetría wholesale_boxcox a la misma escala, de modo que todas las columnas tengan media cero y desviación estándar 1. Usarás la función StandardScaler del módulo sklearn.preprocessing.

El conjunto de datos sin asimetría wholesale_coxbox que transformaste en el ejercicio anterior se ha importado como un DataFrame de pandas. Además, la instancia StandardScaler() se ha inicializado como scaler.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

  • Ajusta (fit) la instancia scaler inicializada sobre el conjunto de datos transformado con Box-Cox.
  • Transforma y guarda el conjunto de datos escalado como wholesale_scaled.
  • Crea un DataFrame de pandas a partir del conjunto de datos escalado.
  • Imprime la media y la desviación estándar de todas las columnas.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)

# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)

# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
                                       index=wholesale_boxcox.___,
                                       columns=wholesale_boxcox.columns)

# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())
Editar y ejecutar código