Variablen normalisieren

Jetzt folgt der letzte Schritt der Datenaufbereitung. Du bringst den entzerrten Datensatz wholesale_boxcox auf dieselbe Skala, sodass alle Spalten einen Mittelwert von 0 und eine Standardabweichung von 1 haben. Dafür verwendest du die Funktion StandardScaler aus dem Modul sklearn.preprocessing.

Der in der vorherigen Übung transformierte, entzerrte Datensatz wholesale_coxbox wurde als pandas-DataFrame importiert. Außerdem wurde die StandardScaler()-Instanz als scaler initialisiert.

Diese Übung ist Teil des Kurses

<Kurs>Machine Learning für Marketing mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Fitte die initialisierte scaler-Instanz auf den Box-Cox-transformierten Datensatz.
Transformiere den Datensatz und speichere ihn als wholesale_scaled.
Erstelle aus dem skalierten Datensatz einen pandas-DataFrame.
Gib den Mittelwert und die Standardabweichung für alle Spalten aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)

# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)

# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
                                       index=wholesale_boxcox.___,
                                       columns=wholesale_boxcox.columns)

# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())

Code bearbeiten und ausführen