ComenzarEmpieza gratis

Codifica variables categóricas y escala variables numéricas

En este último paso, vas a aplicar one-hot encoding a las variables categóricas y después escalar las columnas numéricas. La biblioteca pandas está cargada como pd, así como el módulo StandardScaler de sklearn.preprocessing.

El conjunto de datos original de churn de telecomunicaciones telco_raw se ha cargado como un DataFrame de pandas, junto con las listas custid, target, categorical y numerical con los nombres de columnas que creaste en el ejercicio anterior. Puedes familiarizarte con el conjunto de datos explorándolo en la consola.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

  • Aplica one-hot encoding a las variables categóricas.
  • Inicializa una instancia de StandardScaler.
  • Ajusta y transforma el scaler sobre las columnas numéricas.
  • Crea un DataFrame a partir de scaled_numerical.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Perform one-hot encoding to categorical variables 
telco_raw = pd.get_dummies(data = ___, columns = categorical, drop_first=True)

# Initialize StandardScaler instance
scaler = ___()

# Fit and transform the scaler on numerical columns
scaled_numerical = ___.fit_transform(telco_raw[___])

# Build a DataFrame from scaled_numerical
scaled_numerical = pd.DataFrame(___, columns=numerical)
Editar y ejecutar código