IniziaInizia gratis

Label encoding

Lavoriamo sulla codifica delle variabili categoriche. Userai di nuovo un sottoinsieme della competizione House Prices su Kaggle.

Il tuo obiettivo è codificare le feature categoriche "RoofStyle" e "CentralAir" usando il label encoding. I DataFrame train e test sono già disponibili nel tuo workspace.

Questo esercizio fa parte del corso

Vincere una competizione Kaggle con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Concatena i DataFrame train e test in un unico DataFrame houses.
  • Crea un oggetto LabelEncoder senza argomenti e assegnalo a le.
  • Crea nuove feature con label encoding per "RoofStyle" e "CentralAir" usando lo stesso oggetto le.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Concatenate train and test together
houses = ____.____([train, test])

# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()

# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])

# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())
Modifica ed esegui il codice