Mise à l’échelle des données – standardiser des colonnes

Puisque nous savons que les colonnes Ash, Alcalinity of ash et Magnesium du jeu de données wine sont sur des échelles différentes, standardisons-les pour pouvoir les utiliser dans un modèle linéaire.

Cet exercice fait partie du cours

<cours>Prétraitement pour le Machine Learning en Python</cours>

Voir le cours

Instructions de l’exercice

Importez la classe StandardScaler.
Instanciez un StandardScaler() et stockez-le dans la variable scaler.
Créez un sous-ensemble du DataFrame wine contenant les colonnes Ash, Alcalinity of ash et Magnesium, et assignez-le à wine_subset.
Ajustez et transformez le standard scaler sur wine_subset.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import StandardScaler
from sklearn.preprocessing import ____

# Create the scaler
scaler = ____

# Subset the DataFrame you want to scale 
____ = wine[[____]]

# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)

Modifier et exécuter le code