Mise à l’échelle des données – standardiser des colonnes
Puisque nous savons que les colonnes Ash, Alcalinity of ash et Magnesium du jeu de données wine sont sur des échelles différentes, standardisons-les pour pouvoir les utiliser dans un modèle linéaire.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Importez la classe
StandardScaler. - Instanciez un
StandardScaler()et stockez-le dans la variablescaler. - Créez un sous-ensemble du DataFrame
winecontenant les colonnesAsh,Alcalinity of ashetMagnesium, et assignez-le àwine_subset. - Ajustez et transformez le standard scaler sur
wine_subset.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)