ComenzarEmpieza gratis

Codificación de variables categóricas - one-hot

Una de las columnas del conjunto de datos volunteer, category_desc, ofrece descripciones de las categorías de las oportunidades de voluntariado enumeradas. Como se trata de una variable categórica con más de dos categorías, tenemos que utilizar la codificación de un punto para transformar numéricamente esta columna. Para ello, utiliza la función pd.get_dummies() de pandas.

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones de ejercicio

  • Llama a get_dummies() en la columna volunteer["category_desc"] para crear las columnas codificadas y asígnala a category_enc.
  • Imprime la .head() de la variable category_enc para echar un vistazo a las columnas codificadas.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Editar y ejecutar código