Normaliza las variables
Ahora, el último paso de la preparación de datos. Vas a transformar el conjunto de datos sin asimetría wholesale_boxcox a la misma escala, de modo que todas las columnas tengan media cero y desviación estándar 1. Usarás la función StandardScaler del módulo sklearn.preprocessing.
El conjunto de datos sin asimetría wholesale_coxbox que transformaste en el ejercicio anterior se ha importado como un DataFrame de pandas. Además, la instancia StandardScaler() se ha inicializado como scaler.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Ajusta (fit) la instancia
scalerinicializada sobre el conjunto de datos transformado con Box-Cox. - Transforma y guarda el conjunto de datos escalado como
wholesale_scaled. - Crea un DataFrame de
pandasa partir del conjunto de datos escalado. - Imprime la media y la desviación estándar de todas las columnas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)
# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)
# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
index=wholesale_boxcox.___,
columns=wholesale_boxcox.columns)
# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())