Mengode fitur kategorikal
Terkadang sebuah himpunan data memuat nilai numerik yang merepresentasikan fitur kategorikal.
Dalam himpunan data donors, wealth_rating menggunakan angka untuk menunjukkan tingkat kekayaan donor:
- 0 = Tidak diketahui
- 1 = Rendah
- 2 = Sedang
- 3 = Tinggi
Latihan ini memperlihatkan cara menyiapkan jenis fitur kategorikal seperti ini dan menelaah dampaknya pada model regresi logistik. Bingkai data donors tersedia untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Klasifikasi
Petunjuk latihan
- Buat faktor
wealth_levelsdariwealth_ratingnumerik dengan label seperti yang ditunjukkan dengan memberikan fungsifactor()kolom yang ingin Anda ubah, level satu per satu, dan labelnya. - Gunakan
relevel()untuk mengubah kategori acuan menjadiMedium. Argumen pertama harus berupa kolomfactorbaru Anda. - Bangun model regresi logistik menggunakan kolom
wealth_levelsuntuk memprediksidonateddan tampilkan hasilnya dengansummary().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)
# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)
# See how our factor coding impacts the model
summary(___)