Creare dummies da una variabile con molte categorie
Ti viene fornito un basetable con una variabile predittiva "country". Assicurati che "country" possa essere usata come variabile predittiva in un modello di regressione logistica creando per essa le variabili dummy.
Questo esercizio fa parte del corso
Analisi predittiva intermedia in Python
Istruzioni dell'esercizio
- Crea un dataframe pandas
dummies_countryche contenga le variabili dummy per "country". Assicurati di evitare la multicollinearità. - Aggiungi queste dummies al
basetableoriginale. - Rimuovi dal
basetablela variabile originale "country".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)
# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)
# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())