CommencerCommencer gratuitement

Mise à l’échelle des données – standardiser des colonnes

Puisque nous savons que les colonnes Ash, Alcalinity of ash et Magnesium du jeu de données wine sont sur des échelles différentes, standardisons-les pour pouvoir les utiliser dans un modèle linéaire.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Importez la classe StandardScaler.
  • Instanciez un StandardScaler() et stockez-le dans la variable scaler.
  • Créez un sous-ensemble du DataFrame wine contenant les colonnes Ash, Alcalinity of ash et Magnesium, et assignez-le à wine_subset.
  • Ajustez et transformez le standard scaler sur wine_subset.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import StandardScaler
from sklearn.preprocessing import ____

# Create the scaler
scaler = ____

# Subset the DataFrame you want to scale 
____ = wine[[____]]

# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)
Modifier et exécuter le code