ComenzarEmpieza gratis

Crear una dummy a partir de una variable con dos categorías

Se te da un basetable con una variable predictora "gender". Asegúrate de que "gender" pueda usarse como variable predictora en un modelo de regresión logística creando variables ficticias (dummies) para ella.

Este ejercicio forma parte del curso

Análisis predictivo intermedio en Python

Ver curso

Instrucciones del ejercicio

  • Crea un dataframe de pandas dummies_gender que contenga las variables ficticias (dummies) para "gender". Asegúrate de evitar la multicolinealidad.
  • Añade estas dummies al basetable original.
  • Elimina la variable original "gender" del basetable.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)

# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)

# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())
Editar y ejecutar código