LoslegenKostenlos starten

Zentrieren und Skalieren mit StandardScaler()

Wir haben den gleichen Datensatz namens data geladen. Dein Ziel ist es nun, ihn mit dem StandardScaler aus der sklearn-Bibliothek zu zentrieren und zu skalieren.

Die Bibliotheken pandas, numpy, seaborn und matplotlib.pyplot wurden als pd, np, sns bzw. plt geladen. Außerdem haben wir den StandardScaler importiert.

Du kannst den Datensatz gerne in der Konsole erkunden.

Diese Übung ist Teil des Kurses

<Kurs>Kundensegmentierung in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Initialisiere eine StandardScaler-Instanz als scaler und fitte sie auf data.
  • Transformiere data, indem du es mit scaler skalierst und zentrierst.
  • Erstelle aus data_normalized ein pandas-DataFrame und übernimm Index und Spaltennamen von data.
  • Gib zusammenfassende Statistiken aus, um sicherzustellen, dass der Mittelwert null und die Standardabweichung eins ist, und runde die Ergebnisse auf 2 Dezimalstellen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Initialize a scaler
scaler = ____()

# Fit the scaler
____.____(data)

# Scale and center the data
data_normalized = ____.____(data)

# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)

# Print summary statistics
print(data_normalized.____().round(____))
Code bearbeiten und ausführen