Daten skalieren – Spalten standardisieren
Da wir wissen, dass die Spalten Ash, Alcalinity of ash und Magnesium im wine-Datensatz auf unterschiedlichen Skalen liegen, standardisieren wir sie so, dass sie in einem linearen Modell verwendet werden können.
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Importiere die Klasse
StandardScaler. - Instanziiere einen
StandardScaler()und speichere ihn in der Variablenscaler. - Erstelle einen Teil-DataFrame aus
winemit den SpaltenAsh,Alcalinity of ashundMagnesiumund weise ihnwine_subsetzu. - Fitte den Standard-Scaler auf
wine_subsetund transformiere die Daten.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)