MulaiMulai sekarang secara gratis

Pengodean label

Mari berlatih mengodekan variabel kategorikal. Anda akan kembali bekerja dengan contoh subset dari kompetisi House Prices di Kaggle.

Tujuan Anda adalah mengodekan fitur kategorikal "RoofStyle" dan "CentralAir" menggunakan label encoding. DataFrame train dan test sudah tersedia di workspace Anda.

Latihan ini adalah bagian dari kursus

Memenangi Kompetisi Kaggle dengan Python

Lihat Kursus

Petunjuk latihan

  • Gabungkan DataFrame train dan test menjadi satu DataFrame houses.
  • Buat objek LabelEncoder tanpa argumen dan simpan ke le.
  • Buat fitur baru hasil label encoding untuk "RoofStyle" dan "CentralAir" menggunakan objek le yang sama.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Concatenate train and test together
houses = ____.____([train, test])

# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()

# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])

# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())
Edit dan Jalankan Kode