ComenzarEmpieza gratis

Codificación por etiquetas

Vamos a trabajar la codificación de variables categóricas. De nuevo usarás una submuestra de la competición House Prices de Kaggle.

Tu objetivo es codificar las variables categóricas "RoofStyle" y "CentralAir" usando codificación por etiquetas. Los DataFrames train y test ya están disponibles en tu espacio de trabajo.

Este ejercicio forma parte del curso

Cómo ganar una competición de Kaggle con Python

Ver curso

Instrucciones del ejercicio

  • Concatena los DataFrames train y test en un único DataFrame houses.
  • Crea un objeto LabelEncoder sin argumentos y asígnalo a le.
  • Crea nuevas características codificadas por etiquetas para "RoofStyle" y "CentralAir" usando el mismo objeto le.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Concatenate train and test together
houses = ____.____([train, test])

# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()

# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])

# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())
Editar y ejecutar código