Daten vorverarbeiten

Der erste Schritt im Segmentierungsprozess ist die Vorverarbeitung der Daten. Du wendest eine Log-Transformation an und normalisierst anschließend die Daten, um sie für das Clustering vorzubereiten.

Wir haben den Datensatz mit RFMT-Werten als datamart_rfmt geladen. Außerdem ist die Bibliothek pandas als pd und numpy als np geladen.

Du kannst den erweiterten RFMT-Datensatz gerne in der Konsole erkunden.

Diese Übung ist Teil des Kurses

Kundensegmentierung in Python

Kurs anzeigen

Anleitung zur Übung

Importiere StandardScaler, initialisiere ihn und speichere ihn als scaler.
Wende die Log-Transformation auf die Roh-RFMT-Daten an.
Initialisiere den Scaler und fitte ihn auf die log-transformierten Daten.
Transformiere die Daten und speichere das Ergebnis als datamart_rfmt_normalized.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import StandardScaler 
from ____.____ import ____

# Apply log transformation
datamart_rfmt_log = ____.____(____)

# Initialize StandardScaler and fit it 
scaler = ____(); ____.fit(____)

# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)

Code bearbeiten und ausführen