MulaiMulai sekarang secara gratis

Pengodean variabel kategorikal

Ada beberapa kolom dalam himpunan data UFO yang perlu dikodekan sebelum dapat dimodelkan dengan scikit-learn. Anda akan melakukan transformasi tersebut di sini, menggunakan metode pengodean biner dan one-hot.

Latihan ini adalah bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Dengan apply(), tulis fungsi lambda bersyarat yang mengembalikan 1 jika nilainya "us", selain itu kembalikan 0.
  • Cetak jumlah nilai .unique() pada kolom type.
  • Dengan pd.get_dummies(), buat satu set one-hot encoded dari kolom type.
  • Terakhir, gunakan pd.concat() untuk menggabungkan variabel terenkode type_set ke himpunan data ufo.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Use pandas to encode us values as 1 and others as 0
ufo["country_enc"] = ufo["country"].____

# Print the number of unique type values
print(len(____.unique()))

# Create a one-hot encoded set of the type values
type_set = ____

# Concatenate this set back to the ufo DataFrame
ufo = pd.concat([____, ____], axis=1)
Edit dan Jalankan Kode