Label encoding
Lavoriamo sulla codifica delle variabili categoriche. Userai di nuovo un sottoinsieme della competizione House Prices su Kaggle.
Il tuo obiettivo è codificare le feature categoriche "RoofStyle" e "CentralAir" usando il label encoding. I DataFrame train e test sono già disponibili nel tuo workspace.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
Istruzioni dell'esercizio
- Concatena i DataFrame
trainetestin un unico DataFramehouses. - Crea un oggetto
LabelEncodersenza argomenti e assegnalo ale. - Crea nuove feature con label encoding per "RoofStyle" e "CentralAir" usando lo stesso oggetto
le.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Concatenate train and test together
houses = ____.____([train, test])
# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()
# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])
# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())