Pengodean label
Mari berlatih mengodekan variabel kategorikal. Anda akan kembali bekerja dengan contoh subset dari kompetisi House Prices di Kaggle.
Tujuan Anda adalah mengodekan fitur kategorikal "RoofStyle" dan "CentralAir" menggunakan label encoding. DataFrame train dan test sudah tersedia di workspace Anda.
Latihan ini merupakan bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Instruksi latihan
- Gabungkan DataFrame
traindantestmenjadi satu DataFramehouses. - Buat objek
LabelEncodertanpa argumen dan simpan kele. - Buat fitur baru hasil label encoding untuk "RoofStyle" dan "CentralAir" menggunakan objek
leyang sama.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Concatenate train and test together
houses = ____.____([train, test])
# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()
# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])
# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())