Zentrieren und Skalieren mit StandardScaler()
Wir haben den gleichen Datensatz namens data geladen. Dein Ziel ist es nun, ihn mit dem StandardScaler aus der sklearn-Bibliothek zu zentrieren und zu skalieren.
Die Bibliotheken pandas, numpy, seaborn und matplotlib.pyplot wurden als pd, np, sns bzw. plt geladen. Außerdem haben wir den StandardScaler importiert.
Du kannst den Datensatz gerne in der Konsole erkunden.
Diese Übung ist Teil des Kurses
Kundensegmentierung in Python
Anleitung zur Übung
- Initialisiere eine
StandardScaler-Instanz alsscalerund fitte sie aufdata. - Transformiere
data, indem du es mitscalerskalierst und zentrierst. - Erstelle aus
data_normalizedein pandas-DataFrame und übernimm Index und Spaltennamen vondata. - Gib zusammenfassende Statistiken aus, um sicherzustellen, dass der Mittelwert null und die Standardabweichung eins ist, und runde die Ergebnisse auf 2 Dezimalstellen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Initialize a scaler
scaler = ____()
# Fit the scaler
____.____(data)
# Scale and center the data
data_normalized = ____.____(data)
# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)
# Print summary statistics
print(data_normalized.____().round(____))