Aan de slagGa gratis aan de slag

Gegevens schalen - kolommen standaardiseren

Omdat we weten dat de kolommen Ash, Alcalinity of ash en Magnesium in de wine-gegevensset elk een andere schaal hebben, gaan we ze standaardiseren zodat ze geschikt zijn voor gebruik in een lineair model.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Importeer de klasse StandardScaler.
  • Maak een instantie van StandardScaler() en sla die op in de variabele scaler.
  • Maak een subset van de wine-DataFrame met de kolommen Ash, Alcalinity of ash en Magnesium, en wijs die toe aan wine_subset.
  • Fit en transformeer de standaardscaler op wine_subset.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import StandardScaler
from sklearn.preprocessing import ____

# Create the scaler
scaler = ____

# Subset the DataFrame you want to scale 
____ = wine[[____]]

# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)
Code bewerken en uitvoeren