Creare una dummy da una variabile con due categorie
Ti viene fornito un basetable con una variabile predittiva "gender". Assicurati che "gender" possa essere usata come variabile predittiva in un modello di regressione logistica creando per essa delle variabili dummy.
Questo esercizio fa parte del corso
Analisi predittiva intermedia in Python
Istruzioni dell'esercizio
- Crea un dataframe pandas
dummies_genderche contenga le variabili dummy per "gender". Assicurati di evitare la multicollinearità. - Aggiungi queste dummy al
basetableoriginale. - Rimuovi la variabile originale "gender" dal
basetable.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())