Inizia subitoInizia gratis

One-hot encoding e variabili dummy

Per usare variabili categoriche in un modello di Machine Learning, devi prima rappresentarle in modo quantitativo. Gli approcci più comuni sono il one-hot encoding delle variabili oppure l’uso di variabili dummy. In questo esercizio creerai entrambi i tipi di codifica e confronterai i set di colonne generati. Continueremo a usare lo stesso DataFrame della lezione precedente, caricato come so_survey_df, concentrandoci sulla sua colonna Country.

Questo esercizio fa parte del corso

Feature Engineering per il Machine Learning in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')

# Print the columns names
print(one_hot_encoded.columns)
Modifica ed esegui il codice