Mulai sekarangMulai gratis

Dimensionalitas dan informasi fitur

Bayangkan Anda bekerja di sebuah bank dan telah mengumpulkan informasi tentang berbagai pinjaman yang diberikan kepada orang yang berbeda. Atasan Anda ingin Anda mulai mengeksplorasi kemungkinan menggunakan data ini untuk mengklasifikasikan nasabah ke dalam kategori skor kredit yang berbeda. Contoh data yang tersedia telah dimuat ke dalam credit_df. Anda ingin tahu berapa banyak fitur yang dimiliki data tersebut. Anda juga ingin mengidentifikasi fitur yang tidak akan berguna untuk mengklasifikasikan nasabah ke kategori kredit yang berbeda.

Paket tidyverse telah dimuat untuk Anda.

Latihan ini merupakan bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Instruksi latihan

  • Cari jumlah fitur dalam credit_df.
  • Hitung varians tiap fitur dalam credit_df.
  • Identifikasi fitur dengan varians nol dan tetapkan ke column_to_remove.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Find the number of features
___ %>% ___()

# Compute each column variance
credit_df %>% 
  ___(___(___(), ~ ___(., na.rm = TRUE))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "variance")

# Assign the zero-variance column
column_to_remove <- "___"
Edit dan Jalankan Kode