Dimensionalitas dan informasi fitur
Bayangkan Anda bekerja di sebuah bank dan telah mengumpulkan informasi tentang berbagai pinjaman yang diberikan kepada orang yang berbeda. Atasan Anda ingin Anda mulai mengeksplorasi kemungkinan menggunakan data ini untuk mengklasifikasikan nasabah ke dalam kategori skor kredit yang berbeda. Contoh data yang tersedia telah dimuat ke dalam credit_df. Anda ingin tahu berapa banyak fitur yang dimiliki data tersebut. Anda juga ingin mengidentifikasi fitur yang tidak akan berguna untuk mengklasifikasikan nasabah ke kategori kredit yang berbeda.
Paket tidyverse telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Cari jumlah fitur dalam
credit_df. - Hitung varians tiap fitur dalam
credit_df. - Identifikasi fitur dengan varians nol dan tetapkan ke
column_to_remove.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Find the number of features
___ %>% ___()
# Compute each column variance
credit_df %>%
___(___(___(), ~ ___(., na.rm = TRUE))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "variance")
# Assign the zero-variance column
column_to_remove <- "___"