LoslegenKostenlos loslegen

Variablen normalisieren

Jetzt folgt der letzte Schritt der Datenaufbereitung. Du bringst den entzerrten Datensatz wholesale_boxcox auf dieselbe Skala, sodass alle Spalten einen Mittelwert von 0 und eine Standardabweichung von 1 haben. Dafür verwendest du die Funktion StandardScaler aus dem Modul sklearn.preprocessing.

Der in der vorherigen Übung transformierte, entzerrte Datensatz wholesale_coxbox wurde als pandas-DataFrame importiert. Außerdem wurde die StandardScaler()-Instanz als scaler initialisiert.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing mit Python

Kurs anzeigen

Anleitung zur Übung

  • Fitte die initialisierte scaler-Instanz auf den Box-Cox-transformierten Datensatz.
  • Transformiere den Datensatz und speichere ihn als wholesale_scaled.
  • Erstelle aus dem skalierten Datensatz einen pandas-DataFrame.
  • Gib den Mittelwert und die Standardabweichung für alle Spalten aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)

# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)

# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
                                       index=wholesale_boxcox.___,
                                       columns=wholesale_boxcox.columns)

# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())
Code bearbeiten und ausführen