Codificación One-Hot
El problema de la codificación por etiquetas es que asume implícitamente que existe un orden entre las categorías. Así que vamos a cambiar el método de codificación para las variables "RoofStyle" y "CentralAir" a codificación one-hot. De nuevo, los DataFrames train y test de la competición House Prices de Kaggle ya están disponibles en tu espacio de trabajo.
Recuerda que, si trabajas con variables binarias (categóricas con solo dos categorías), se sugiere aplicar únicamente el codificador por etiquetas.
Tu objetivo es determinar cuál de las variables mencionadas no es binaria y aplicar one-hot encoding solo a esa.
Este ejercicio forma parte del curso
Cómo ganar una competición de Kaggle con Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Concatenate train and test together
houses = pd.concat([train, test])
# Look at feature distributions
print(houses['RoofStyle'].____, '\n')
print(houses['CentralAir'].____)