Centrer et mettre à l’échelle avec StandardScaler()
Nous avons chargé le même jeu de données nommé data. Votre objectif est maintenant de le centrer et de le mettre à l’échelle avec StandardScaler de la bibliothèque sklearn.
Les bibliothèques pandas, numpy, seaborn et matplotlib.pyplot ont été chargées en tant que pd, np, sns et plt respectivement. Nous avons également importé StandardScaler.
N’hésitez pas à explorer le jeu de données dans la console.
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Initialisez une instance de
StandardScalersous le nomscaleret ajustez-la àdata. - Transformez
dataen le centrant et en le mettant à l’échelle avecscaler. - Créez un DataFrame pandas à partir de
data_normalizeden reprenant l’index et les noms de colonnes dedata. - Affichez des statistiques récapitulatives pour vérifier que la moyenne est zéro et l’écart type est un, et arrondissez les résultats à 2 décimales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Initialize a scaler
scaler = ____()
# Fit the scaler
____.____(data)
# Scale and center the data
data_normalized = ____.____(data)
# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)
# Print summary statistics
print(data_normalized.____().round(____))