RFM-Daten vorverarbeiten
Wir haben den Datensatz mit den RFM-Werten, die du zuvor berechnet hast, als datamart_rfm geladen. Da die Variablen schief verteilt sind und unterschiedliche Skalen haben, wirst du sie nun entzerren und normalisieren.
Die Bibliothek pandas ist als pd geladen und numpy als np. Nimm dir etwas Zeit, um datamart_rfm in der Konsole zu erkunden.
Diese Übung ist Teil des Kurses
<Kurs>Kundensegmentierung in Python</Kurs>Übungsanweisungen
- Wende eine Log-Transformation an, um
datamart_rfmzu entzerren, und speichere das Ergebnis alsdatamart_log. - Initialisiere eine Instanz von
StandardScaler()alsscalerund passe sie an die Datendatamart_logan. - Transformiere die
data, indem du sie mitscalerskalierst und zentrierst. - Erstelle aus 'datamart_normalized' einen pandas DataFrame und übernimm
indexund Spaltennamen ausdatamart_rfm.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Unskew the data
datamart_log = np.____(____)
# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)
# Scale and center the data
datamart_normalized = ____.____(____)
# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)