Codificación por etiquetas
Vamos a trabajar la codificación de variables categóricas. De nuevo usarás una submuestra de la competición House Prices de Kaggle.
Tu objetivo es codificar las variables categóricas "RoofStyle" y "CentralAir" usando codificación por etiquetas. Los DataFrames train y test ya están disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Cómo ganar una competición de Kaggle con Python
Instrucciones del ejercicio
- Concatena los DataFrames
trainytesten un único DataFramehouses. - Crea un objeto
LabelEncodersin argumentos y asígnalo ale. - Crea nuevas características codificadas por etiquetas para "RoofStyle" y "CentralAir" usando el mismo objeto
le.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Concatenate train and test together
houses = ____.____([train, test])
# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()
# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])
# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())