Codifica di variabili categoriche - one-hot
Una delle colonne dell'insieme di dati volunteer, category_desc, contiene le descrizioni di categoria delle opportunità di volontariato elencate. Poiché è una variabile categorica con più di due categorie, dobbiamo usare la one-hot encoding per trasformare numericamente questa colonna. Per farlo, usa la funzione pd.get_dummies() di pandas.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Chiama
get_dummies()sulla colonnavolunteer["category_desc"]per creare le colonne codificate e assegnala acategory_enc. - Stampa il
.head()della variabilecategory_encper dare un'occhiata alle colonne codificate.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)