Pengodean label
Mari berlatih mengodekan variabel kategorikal. Anda akan kembali bekerja dengan contoh subset dari kompetisi House Prices di Kaggle.
Tujuan Anda adalah mengodekan fitur kategorikal "RoofStyle" dan "CentralAir" menggunakan label encoding. DataFrame train dan test sudah tersedia di workspace Anda.
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Petunjuk latihan
- Gabungkan DataFrame
traindantestmenjadi satu DataFramehouses. - Buat objek
LabelEncodertanpa argumen dan simpan kele. - Buat fitur baru hasil label encoding untuk "RoofStyle" dan "CentralAir" menggunakan objek
leyang sama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Concatenate train and test together
houses = ____.____([train, test])
# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()
# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])
# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())