MulaiMulai sekarang secara gratis

Membuat dummy dari variabel dengan banyak kategori

Diberikan sebuah basetable dengan satu variabel prediktor "country". Pastikan "country" dapat digunakan sebagai variabel prediktor dalam model regresi logistik dengan membuat variabel dummy untuknya.

Latihan ini adalah bagian dari kursus

Predictive Analytics Tingkat Menengah dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat dataframe pandas dummies_country yang berisi variabel dummy untuk "country". Pastikan Anda menghindari multikolinearitas.
  • Tambahkan dummy tersebut ke basetable asli.
  • Hapus variabel asli "country" dari basetable.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)

# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)

# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())
Edit dan Jalankan Kode