Preprocesar datos RFM
Hemos cargado el conjunto de datos con los valores RFM que calculaste previamente como datamart_rfm. Como las variables están sesgadas y en escalas distintas, ahora vas a desviar ese sesgo y normalizarlas.
La librería pandas está cargada como pd, y numpy como np. Tómate un momento para explorar datamart_rfm en la consola.
Este ejercicio forma parte del curso
Segmentación de clientes en Python
Instrucciones del ejercicio
- Aplica una transformación logarítmica para corregir el sesgo de
datamart_rfmy guárdalo comodatamart_log. - Inicializa una instancia de
StandardScaler()comoscalery ajústala (fit) con los datos dedatamart_log. - Transforma los
dataescalándolos y centrando conscaler. - Crea un DataFrame de pandas a partir de 'datamart_normalized' añadiendo los nombres de índice y columnas de
datamart_rfm.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Unskew the data
datamart_log = np.____(____)
# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)
# Scale and center the data
datamart_normalized = ____.____(____)
# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)