RFM-Daten vorverarbeiten
Wir haben den Datensatz mit den RFM-Werten, die du zuvor berechnet hast, als datamart_rfm geladen. Da die Variablen schief verteilt sind und unterschiedliche Skalen haben, wirst du sie nun entzerren und normalisieren.
Die Bibliothek pandas ist als pd geladen und numpy als np. Nimm dir etwas Zeit, um datamart_rfm in der Konsole zu erkunden.
Diese Übung ist Teil des Kurses
Kundensegmentierung in Python
Anleitung zur Übung
- Wende eine Log-Transformation an, um
datamart_rfmzu entzerren, und speichere das Ergebnis alsdatamart_log. - Initialisiere eine Instanz von
StandardScaler()alsscalerund passe sie an die Datendatamart_logan. - Transformiere die
data, indem du sie mitscalerskalierst und zentrierst. - Erstelle aus 'datamart_normalized' einen pandas DataFrame und übernimm
indexund Spaltennamen ausdatamart_rfm.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Unskew the data
datamart_log = np.____(____)
# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)
# Scale and center the data
datamart_normalized = ____.____(____)
# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)