One-hot encoding e variabili dummy
Per usare variabili categoriche in un modello di Machine Learning, devi prima rappresentarle in modo quantitativo. Gli approcci più comuni sono il one-hot encoding delle variabili oppure l’uso di variabili dummy. In questo esercizio creerai entrambi i tipi di codifica e confronterai i set di colonne generati. Continueremo a usare lo stesso DataFrame della lezione precedente, caricato come so_survey_df, concentrandoci sulla sua colonna Country.
Questo esercizio fa parte del corso
Feature Engineering per il Machine Learning in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')
# Print the columns names
print(one_hot_encoded.columns)