RFM-Daten vorverarbeiten

Wir haben den Datensatz mit den RFM-Werten, die du zuvor berechnet hast, als datamart_rfm geladen. Da die Variablen schief verteilt sind und unterschiedliche Skalen haben, wirst du sie nun entzerren und normalisieren.

Die Bibliothek pandas ist als pd geladen und numpy als np. Nimm dir etwas Zeit, um datamart_rfm in der Konsole zu erkunden.

Diese Übung ist Teil des Kurses

Kundensegmentierung in Python

Kurs anzeigen

Anleitung zur Übung

Wende eine Log-Transformation an, um datamart_rfm zu entzerren, und speichere das Ergebnis als datamart_log.
Initialisiere eine Instanz von StandardScaler() als scaler und passe sie an die Daten datamart_log an.
Transformiere die data, indem du sie mit scaler skalierst und zentrierst.
Erstelle aus 'datamart_normalized' einen pandas DataFrame und übernimm index und Spaltennamen aus datamart_rfm.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Unskew the data
datamart_log = np.____(____)

# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)

# Scale and center the data
datamart_normalized = ____.____(____)

# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)

Code bearbeiten und ausführen