Variablen normalisieren
Jetzt folgt der letzte Schritt der Datenaufbereitung. Du bringst den entzerrten Datensatz wholesale_boxcox auf dieselbe Skala, sodass alle Spalten einen Mittelwert von 0 und eine Standardabweichung von 1 haben. Dafür verwendest du die Funktion StandardScaler aus dem Modul sklearn.preprocessing.
Der in der vorherigen Übung transformierte, entzerrte Datensatz wholesale_coxbox wurde als pandas-DataFrame importiert. Außerdem wurde die StandardScaler()-Instanz als scaler initialisiert.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing mit Python
Anleitung zur Übung
- Fitte die initialisierte
scaler-Instanz auf den Box-Cox-transformierten Datensatz. - Transformiere den Datensatz und speichere ihn als
wholesale_scaled. - Erstelle aus dem skalierten Datensatz einen
pandas-DataFrame. - Gib den Mittelwert und die Standardabweichung für alle Spalten aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)
# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)
# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
index=wholesale_boxcox.___,
columns=wholesale_boxcox.columns)
# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())