Crear dummies a partir de una variable con muchas categorías
Se te proporciona un basetable con una variable predictora "country". Asegúrate de que "country" pueda usarse como variable predictora en un modelo de regresión logística creando variables ficticias (dummies) para ella.
Este ejercicio forma parte del curso
Análisis predictivo intermedio en Python
Instrucciones del ejercicio
- Crea un dataframe de pandas
dummies_countryque contenga las variables ficticias (dummies) de "country". Asegúrate de evitar la multicolinealidad. - Añade estas dummies al
basetableoriginal. - Elimina la variable original "country" del
basetable.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)
# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)
# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())