IniziaInizia gratis

One-hot encoding e variabili dummy

Per usare variabili categoriche in un modello di Machine Learning, devi prima rappresentarle in modo quantitativo. Gli approcci più comuni sono il one-hot encoding delle variabili oppure l’uso di variabili dummy. In questo esercizio creerai entrambi i tipi di codifica e confronterai i set di colonne generati. Continueremo a usare lo stesso DataFrame della lezione precedente, caricato come so_survey_df, concentrandoci sulla sua colonna Country.

Questo esercizio fa parte del corso

Feature Engineering per il Machine Learning in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')

# Print the columns names
print(one_hot_encoded.columns)
Modifica ed esegui il codice