MulaiMulai sekarang secara gratis

Mengode fitur kategorikal

Terkadang sebuah himpunan data memuat nilai numerik yang merepresentasikan fitur kategorikal.

Dalam himpunan data donors, wealth_rating menggunakan angka untuk menunjukkan tingkat kekayaan donor:

  • 0 = Tidak diketahui
  • 1 = Rendah
  • 2 = Sedang
  • 3 = Tinggi

Latihan ini memperlihatkan cara menyiapkan jenis fitur kategorikal seperti ini dan menelaah dampaknya pada model regresi logistik. Bingkai data donors tersedia untuk Anda gunakan.

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Klasifikasi

Lihat Kursus

Petunjuk latihan

  • Buat faktor wealth_levels dari wealth_rating numerik dengan label seperti yang ditunjukkan dengan memberikan fungsi factor() kolom yang ingin Anda ubah, level satu per satu, dan labelnya.
  • Gunakan relevel() untuk mengubah kategori acuan menjadi Medium. Argumen pertama harus berupa kolom factor baru Anda.
  • Bangun model regresi logistik menggunakan kolom wealth_levels untuk memprediksi donated dan tampilkan hasilnya dengan summary().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)

# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)

# See how our factor coding impacts the model
summary(___)
Edit dan Jalankan Kode