Daten vorverarbeiten
Der erste Schritt im Segmentierungsprozess ist die Vorverarbeitung der Daten. Du wendest eine Log-Transformation an und normalisierst anschließend die Daten, um sie für das Clustering vorzubereiten.
Wir haben den Datensatz mit RFMT-Werten als datamart_rfmt geladen. Außerdem ist die Bibliothek pandas als pd und numpy als np geladen.
Du kannst den erweiterten RFMT-Datensatz gerne in der Konsole erkunden.
Diese Übung ist Teil des Kurses
<Kurs>Kundensegmentierung in Python</Kurs>Übungsanweisungen
- Importiere StandardScaler, initialisiere ihn und speichere ihn als
scaler. - Wende die Log-Transformation auf die Roh-RFMT-Daten an.
- Initialisiere den Scaler und fitte ihn auf die log-transformierten Daten.
- Transformiere die Daten und speichere das Ergebnis als
datamart_rfmt_normalized.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import StandardScaler
from ____.____ import ____
# Apply log transformation
datamart_rfmt_log = ____.____(____)
# Initialize StandardScaler and fit it
scaler = ____(); ____.fit(____)
# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)