CommencerCommencer gratuitement

Normalisation

Comme expliqué dans la vidéo, la normalisation consiste à appliquer une mise à l’échelle linéaire de toute la colonne entre 0 et 1, où 0 correspond à la valeur la plus faible de la colonne et 1 à la plus élevée.
Avec scikit-learn (la bibliothèque de Machine Learning la plus utilisée en Python), vous pouvez utiliser un MinMaxScaler pour appliquer cette normalisation. (Ce nom vient du fait qu’il met vos valeurs à l’échelle entre une valeur minimale et une valeur maximale.)

Cet exercice fait partie du cours

Feature engineering pour le Machine Learning en Python

Afficher le cours

Instructions

  • Importez MinMaxScaler depuis le module preprocessing de sklearn.
  • Instanciez MinMaxScaler() sous le nom MM_scaler.
  • Ajustez le MinMaxScaler sur la colonne Age de so_numeric_df.
  • Transformez cette même colonne avec le scaler que vous venez d’ajuster.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import MinMaxScaler
____

# Instantiate MinMaxScaler
MM_scaler = ____()

# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())
Modifier et exécuter le code