Gegevens schalen - kolommen standaardiseren
Omdat we weten dat de kolommen Ash, Alcalinity of ash en Magnesium in de wine-gegevensset elk een andere schaal hebben, gaan we ze standaardiseren zodat ze geschikt zijn voor gebruik in een lineair model.
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Importeer de klasse
StandardScaler. - Maak een instantie van
StandardScaler()en sla die op in de variabelescaler. - Maak een subset van de
wine-DataFrame met de kolommenAsh,Alcalinity of ashenMagnesium, en wijs die toe aanwine_subset. - Fit en transformeer de standaardscaler op
wine_subset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)