LoslegenKostenlos starten

Daten skalieren – Spalten standardisieren

Da wir wissen, dass die Spalten Ash, Alcalinity of ash und Magnesium im wine-Datensatz auf unterschiedlichen Skalen liegen, standardisieren wir sie so, dass sie in einem linearen Modell verwendet werden können.

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere die Klasse StandardScaler.
  • Instanziiere einen StandardScaler() und speichere ihn in der Variablen scaler.
  • Erstelle einen Teil-DataFrame aus wine mit den Spalten Ash, Alcalinity of ash und Magnesium und weise ihn wine_subset zu.
  • Fitte den Standard-Scaler auf wine_subset und transformiere die Daten.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import StandardScaler
from sklearn.preprocessing import ____

# Create the scaler
scaler = ____

# Subset the DataFrame you want to scale 
____ = wine[[____]]

# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)
Code bearbeiten und ausführen