Daten skalieren – Spalten standardisieren
Da wir wissen, dass die Spalten Ash, Alcalinity of ash und Magnesium im wine-Datensatz auf unterschiedlichen Skalen liegen, standardisieren wir sie so, dass sie in einem linearen Modell verwendet werden können.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Importiere die Klasse
StandardScaler. - Instanziiere einen
StandardScaler()und speichere ihn in der Variablenscaler. - Erstelle einen Teil-DataFrame aus
winemit den SpaltenAsh,Alcalinity of ashundMagnesiumund weise ihnwine_subsetzu. - Fitte den Standard-Scaler auf
wine_subsetund transformiere die Daten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)