ComenzarEmpieza gratis

Codificación One-Hot

El problema de la codificación por etiquetas es que asume implícitamente que existe un orden entre las categorías. Así que vamos a cambiar el método de codificación para las variables "RoofStyle" y "CentralAir" a codificación one-hot. De nuevo, los DataFrames train y test de la competición House Prices de Kaggle ya están disponibles en tu espacio de trabajo.

Recuerda que, si trabajas con variables binarias (categóricas con solo dos categorías), se sugiere aplicar únicamente el codificador por etiquetas.

Tu objetivo es determinar cuál de las variables mencionadas no es binaria y aplicar one-hot encoding solo a esa.

Este ejercicio forma parte del curso

Cómo ganar una competición de Kaggle con Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Concatenate train and test together
houses = pd.concat([train, test])

# Look at feature distributions
print(houses['RoofStyle'].____, '\n')
print(houses['CentralAir'].____)
Editar y ejecutar código