Daten vorverarbeiten
Der erste Schritt im Segmentierungsprozess ist die Vorverarbeitung der Daten. Du wendest eine Log-Transformation an und normalisierst anschließend die Daten, um sie für das Clustering vorzubereiten.
Wir haben den Datensatz mit RFMT-Werten als datamart_rfmt geladen. Außerdem ist die Bibliothek pandas als pd und numpy als np geladen.
Du kannst den erweiterten RFMT-Datensatz gerne in der Konsole erkunden.
Diese Übung ist Teil des Kurses
Kundensegmentierung in Python
Anleitung zur Übung
- Importiere StandardScaler, initialisiere ihn und speichere ihn als
scaler. - Wende die Log-Transformation auf die Roh-RFMT-Daten an.
- Initialisiere den Scaler und fitte ihn auf die log-transformierten Daten.
- Transformiere die Daten und speichere das Ergebnis als
datamart_rfmt_normalized.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import StandardScaler
from ____.____ import ____
# Apply log transformation
datamart_rfmt_log = ____.____(____)
# Initialize StandardScaler and fit it
scaler = ____(); ____.fit(____)
# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)