Data pre-processen

De eerste stap in het segmentatieproces is het pre-processen van de data. Je past een logtransformatie toe en normaliseert daarna de data om die klaar te maken voor clustering.

We hebben de gegevensset met RFMT-waarden ingeladen als datamart_rfmt. Ook is de pandas-bibliotheek geladen als pd, en numpy als np.

Voel je vrij om de uitgebreide RFMT-gegevensset in de console te verkennen.

Deze oefening maakt deel uit van de cursus

Klantsegmentatie in Python

Bekijk cursus

Oefeninstructies

Importeer StandardScaler, initialiseer die en sla op als scaler.
Pas een logtransformatie toe op de ruwe RFMT-data.
Initialiseer de scaler en fit die op de gelogtransformeerde data.
Transformeer en sla de geschaalde data op als datamart_rfmt_normalized.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import StandardScaler 
from ____.____ import ____

# Apply log transformation
datamart_rfmt_log = ____.____(____)

# Initialize StandardScaler and fit it 
scaler = ____(); ____.fit(____)

# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)

Code bewerken en uitvoeren