LoslegenKostenlos loslegen

Zentrieren und Skalieren mit StandardScaler()

Wir haben den gleichen Datensatz namens data geladen. Dein Ziel ist es nun, ihn mit dem StandardScaler aus der sklearn-Bibliothek zu zentrieren und zu skalieren.

Die Bibliotheken pandas, numpy, seaborn und matplotlib.pyplot wurden als pd, np, sns bzw. plt geladen. Außerdem haben wir den StandardScaler importiert.

Du kannst den Datensatz gerne in der Konsole erkunden.

Diese Übung ist Teil des Kurses

Kundensegmentierung in Python

Kurs anzeigen

Anleitung zur Übung

  • Initialisiere eine StandardScaler-Instanz als scaler und fitte sie auf data.
  • Transformiere data, indem du es mit scaler skalierst und zentrierst.
  • Erstelle aus data_normalized ein pandas-DataFrame und übernimm Index und Spaltennamen von data.
  • Gib zusammenfassende Statistiken aus, um sicherzustellen, dass der Mittelwert null und die Standardabweichung eins ist, und runde die Ergebnisse auf 2 Dezimalstellen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Initialize a scaler
scaler = ____()

# Fit the scaler
____.____(data)

# Scale and center the data
data_normalized = ____.____(data)

# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)

# Print summary statistics
print(data_normalized.____().round(____))
Code bearbeiten und ausführen