ComenzarEmpieza gratis

Preprocesar datos RFM

Hemos cargado el conjunto de datos con los valores RFM que calculaste previamente como datamart_rfm. Como las variables están sesgadas y en escalas distintas, ahora vas a desviar ese sesgo y normalizarlas.

La librería pandas está cargada como pd, y numpy como np. Tómate un momento para explorar datamart_rfm en la consola.

Este ejercicio forma parte del curso

Segmentación de clientes en Python

Ver curso

Instrucciones del ejercicio

  • Aplica una transformación logarítmica para corregir el sesgo de datamart_rfm y guárdalo como datamart_log.
  • Inicializa una instancia de StandardScaler() como scaler y ajústala (fit) con los datos de datamart_log.
  • Transforma los data escalándolos y centrando con scaler.
  • Crea un DataFrame de pandas a partir de 'datamart_normalized' añadiendo los nombres de índice y columnas de datamart_rfm.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Unskew the data
datamart_log = np.____(____)

# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)

# Scale and center the data
datamart_normalized = ____.____(____)

# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)
Editar y ejecutar código