Aan de slagBegin gratis

Gegevens schalen - kolommen standaardiseren

Omdat we weten dat de kolommen Ash, Alcalinity of ash en Magnesium in de wine-gegevensset elk een andere schaal hebben, gaan we ze standaardiseren zodat ze geschikt zijn voor gebruik in een lineair model.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Bekijk cursus

Oefeninstructies

  • Importeer de klasse StandardScaler.
  • Maak een instantie van StandardScaler() en sla die op in de variabele scaler.
  • Maak een subset van de wine-DataFrame met de kolommen Ash, Alcalinity of ash en Magnesium, en wijs die toe aan wine_subset.
  • Fit en transformeer de standaardscaler op wine_subset.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import StandardScaler
from sklearn.preprocessing import ____

# Create the scaler
scaler = ____

# Subset the DataFrame you want to scale 
____ = wine[[____]]

# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)
Code bewerken en uitvoeren