Crear una dummy a partir de una variable con dos categorías
Se te da un basetable con una variable predictora "gender". Asegúrate de que "gender" pueda usarse como variable predictora en un modelo de regresión logística creando variables ficticias (dummies) para ella.
Este ejercicio forma parte del curso
Análisis predictivo intermedio en Python
Instrucciones del ejercicio
- Crea un dataframe de pandas
dummies_genderque contenga las variables ficticias (dummies) para "gender". Asegúrate de evitar la multicolinealidad. - Añade estas dummies al
basetableoriginal. - Elimina la variable original "gender" del
basetable.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())