MulaiMulai sekarang secara gratis

Dimensionalitas dan informasi fitur

Bayangkan Anda bekerja di sebuah bank dan telah mengumpulkan informasi tentang berbagai pinjaman yang diberikan kepada orang yang berbeda. Atasan Anda ingin Anda mulai mengeksplorasi kemungkinan menggunakan data ini untuk mengklasifikasikan nasabah ke dalam kategori skor kredit yang berbeda. Contoh data yang tersedia telah dimuat ke dalam credit_df. Anda ingin tahu berapa banyak fitur yang dimiliki data tersebut. Anda juga ingin mengidentifikasi fitur yang tidak akan berguna untuk mengklasifikasikan nasabah ke kategori kredit yang berbeda.

Paket tidyverse telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Petunjuk latihan

  • Cari jumlah fitur dalam credit_df.
  • Hitung varians tiap fitur dalam credit_df.
  • Identifikasi fitur dengan varians nol dan tetapkan ke column_to_remove.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Find the number of features
___ %>% ___()

# Compute each column variance
credit_df %>% 
  ___(___(___(), ~ ___(., na.rm = TRUE))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "variance")

# Assign the zero-variance column
column_to_remove <- "___"
Edit dan Jalankan Kode