Preprocesa los datos
El primer paso del proceso de segmentación es preprocesar los datos. Aplicarás una transformación logarítmica y luego normalizarás los datos para prepararlos para el clustering.
Hemos cargado el conjunto de datos con valores RFMT como datamart_rfmt. Además, la librería pandas está cargada como pd, y numpy como np.
Siéntete libre de explorar el conjunto de datos RFMT ampliado en la consola.
Este ejercicio forma parte del curso
Segmentación de clientes en Python
Instrucciones del ejercicio
- Importa StandardScaler, inicialízalo y guárdalo como
scaler. - Aplica una transformación logarítmica a los datos RFMT en bruto.
- Inicializa el escalador y ajústalo con los datos transformados con log.
- Transforma y guarda los datos escalados como
datamart_rfmt_normalized.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import StandardScaler
from ____.____ import ____
# Apply log transformation
datamart_rfmt_log = ____.____(____)
# Initialize StandardScaler and fit it
scaler = ____(); ____.fit(____)
# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)