Centrar y escalar con StandardScaler()
Hemos cargado el mismo conjunto de datos llamado data. Ahora tu objetivo será centrarlo y escalarlo con StandardScaler de la librería sklearn.
Las librerías pandas, numpy, seaborn y matplotlib.pyplot se han cargado como pd, np, sns y plt respectivamente. También hemos importado StandardScaler.
Si quieres, explora el conjunto de datos en la consola.
Este ejercicio forma parte del curso
Segmentación de clientes en Python
Instrucciones del ejercicio
- Inicializa una instancia de
StandardScalercomoscalery ajústala adataconfit. - Transforma
dataescalándola y centrándola conscaler. - Crea un
DataFramede pandas a partir dedata_normalizedañadiendo el índice y los nombres de columnas dedata. - Imprime estadísticas resumidas para comprobar que la media es cero y la desviación estándar es uno, y redondea los resultados a 2 decimales.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Initialize a scaler
scaler = ____()
# Fit the scaler
____.____(data)
# Scale and center the data
data_normalized = ____.____(data)
# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)
# Print summary statistics
print(data_normalized.____().round(____))