Codificación de variables categóricas - one-hot
Una de las columnas del conjunto de datos volunteer
, category_desc
, ofrece descripciones de las categorías de las oportunidades de voluntariado enumeradas. Como se trata de una variable categórica con más de dos categorías, tenemos que utilizar la codificación de un punto para transformar numéricamente esta columna. Para ello, utiliza la función pd.get_dummies()
de pandas.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Llama a
get_dummies()
en la columnavolunteer["category_desc"]
para crear las columnas codificadas y asígnala acategory_enc
. - Imprime la
.head()
de la variablecategory_enc
para echar un vistazo a las columnas codificadas.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)