MulaiMulai sekarang secara gratis

Buat filter rasio nilai hilang

Data frame house_sales_df berisi variabel target price dan berbagai prediktor yang menggambarkan masing-masing rumah serta menentukan harga jualnya. Beberapa fitur memiliki jumlah nilai hilang yang bervariasi. Jika rasio nilai hilang terlalu tinggi, maka fitur tersebut tidak akan terlalu informatif untuk memprediksi harga rumah. Fitur-fitur seperti ini dapat dihapus. Pada latihan ini, Anda akan menghitung rasio nilai hilang untuk setiap kolom. Ini akan membantu Anda mempertimbangkan ambang batas yang sesuai untuk setiap kolom.

Paket tidyverse telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Petunjuk latihan

  • Simpan jumlah total baris dalam house_sales_df ke dalam n.
  • Hitung rasio nilai hilang untuk setiap kolom di house_sales_df dan simpan dalam missing_vals_df.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate total rows
___ <-  ___(___)

# Calculate missing value ratios
___ <- ___ %>% 
  ___(___(___(), ~ ___(___(.)))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>% 
  mutate(missing_val_ratio = ___ / ___)

# Display missing value ratios
missing_vals_df
Edit dan Jalankan Kode