CommencerCommencer gratuitement

Centrer et mettre à l’échelle avec StandardScaler()

Nous avons chargé le même jeu de données nommé data. Votre objectif est maintenant de le centrer et de le mettre à l’échelle avec StandardScaler de la bibliothèque sklearn.

Les bibliothèques pandas, numpy, seaborn et matplotlib.pyplot ont été chargées en tant que pd, np, sns et plt respectivement. Nous avons également importé StandardScaler.

N’hésitez pas à explorer le jeu de données dans la console.

Cet exercice fait partie du cours

Customer Segmentation in Python

Afficher le cours

Instructions

  • Initialisez une instance de StandardScaler sous le nom scaler et ajustez-la à data.
  • Transformez data en le centrant et en le mettant à l’échelle avec scaler.
  • Créez un DataFrame pandas à partir de data_normalized en reprenant l’index et les noms de colonnes de data.
  • Affichez des statistiques récapitulatives pour vérifier que la moyenne est zéro et l’écart type est un, et arrondissez les résultats à 2 décimales.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize a scaler
scaler = ____()

# Fit the scaler
____.____(data)

# Scale and center the data
data_normalized = ____.____(data)

# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)

# Print summary statistics
print(data_normalized.____().round(____))
Modifier et exécuter le code