One-hot encoding y variables ficticias
Para usar variables categóricas en un modelo de Machine Learning, primero tienes que representarlas de forma cuantitativa. Los dos enfoques más comunes son aplicar one-hot encoding o utilizar variables ficticias (dummy). En este ejercicio, crearás ambos tipos de codificación y compararás los conjuntos de columnas creadas. Seguiremos usando el mismo DataFrame de la lección anterior cargado como so_survey_df, centrándonos en su columna Country.
Este ejercicio forma parte del curso
Ingeniería de características para Machine Learning en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')
# Print the columns names
print(one_hot_encoded.columns)