Data pre-processen
De eerste stap in het segmentatieproces is het pre-processen van de data. Je past een logtransformatie toe en normaliseert daarna de data om die klaar te maken voor clustering.
We hebben de gegevensset met RFMT-waarden ingeladen als datamart_rfmt. Ook is de pandas-bibliotheek geladen als pd, en numpy als np.
Voel je vrij om de uitgebreide RFMT-gegevensset in de console te verkennen.
Deze oefening maakt deel uit van de cursus
Klantsegmentatie in Python
Oefeninstructies
- Importeer StandardScaler, initialiseer die en sla op als
scaler. - Pas een logtransformatie toe op de ruwe RFMT-data.
- Initialiseer de scaler en fit die op de gelogtransformeerde data.
- Transformeer en sla de geschaalde data op als
datamart_rfmt_normalized.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import StandardScaler
from ____.____ import ____
# Apply log transformation
datamart_rfmt_log = ____.____(____)
# Initialize StandardScaler and fit it
scaler = ____(); ____.fit(____)
# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)