EmpezarEmpieza gratis

One-hot encoding y variables ficticias

Para usar variables categóricas en un modelo de Machine Learning, primero tienes que representarlas de forma cuantitativa. Los dos enfoques más comunes son aplicar one-hot encoding o utilizar variables ficticias (dummy). En este ejercicio, crearás ambos tipos de codificación y compararás los conjuntos de columnas creadas. Seguiremos usando el mismo DataFrame de la lección anterior cargado como so_survey_df, centrándonos en su columna Country.

Este ejercicio forma parte del curso

Ingeniería de características para Machine Learning en Python

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')

# Print the columns names
print(one_hot_encoded.columns)
Editar y ejecutar código