One-hot encoding y variables ficticias

Para usar variables categóricas en un modelo de Machine Learning, primero tienes que representarlas de forma cuantitativa. Los dos enfoques más comunes son aplicar one-hot encoding o utilizar variables ficticias (dummy). En este ejercicio, crearás ambos tipos de codificación y compararás los conjuntos de columnas creadas. Seguiremos usando el mismo DataFrame de la lección anterior cargado como so_survey_df, centrándonos en su columna Country.

Este ejercicio forma parte del curso

Ingeniería de características para Machine Learning en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')

# Print the columns names
print(one_hot_encoded.columns)

Editar y ejecutar código