Mulai sekarangMulai gratis

Pengodean label

Mari berlatih mengodekan variabel kategorikal. Anda akan kembali bekerja dengan contoh subset dari kompetisi House Prices di Kaggle.

Tujuan Anda adalah mengodekan fitur kategorikal "RoofStyle" dan "CentralAir" menggunakan label encoding. DataFrame train dan test sudah tersedia di workspace Anda.

Latihan ini merupakan bagian dari kursus

Memenangi Kompetisi Kaggle dengan Python

Lihat Kursus

Instruksi latihan

  • Gabungkan DataFrame train dan test menjadi satu DataFrame houses.
  • Buat objek LabelEncoder tanpa argumen dan simpan ke le.
  • Buat fitur baru hasil label encoding untuk "RoofStyle" dan "CentralAir" menggunakan objek le yang sama.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Concatenate train and test together
houses = ____.____([train, test])

# Label encoder
from sklearn.preprocessing import LabelEncoder
le = ____()

# Create new features
houses['RoofStyle_enc'] = le.fit_transform(houses[____])
houses['CentralAir_enc'] = ____.____(____[____])

# Look at new features
print(houses[['RoofStyle', 'RoofStyle_enc', 'CentralAir', 'CentralAir_enc']].head())
Edit dan Jalankan Kode