Buat filter nilai hilang
Filter varians nol hanya menghapus sebagian fitur berinformasi rendah. Fitur juga bisa mengandung sedikit atau bahkan tidak ada informasi karena memiliki banyak nilai hilang. Pada latihan ini, Anda akan membuat filter nilai hilang. Anda akan mengambil pendekatan ekstrem dengan menghapus fitur yang memiliki setidaknya satu nilai hilang, yang berarti Anda bisa saja menghapus fitur yang sebenarnya mengandung informasi penting.
house_sales_df tersedia di konsol dan paket tidyverse sudah dimuat untuk Anda.
Latihan ini merupakan bagian dari kursus
Reduksi Dimensi di R
Instruksi latihan
- Buat filter nilai hilang menggunakan
summarize(),across(),sum(), danis.na()untuk menghapus fitur dengan nol atau lebih nilai hilang dan simpan dalamna_filter.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a missing values filter
___ <- ___ %>%
___(across(everything(), ~ ___)) %>%
pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>%
___(___ > ___) %>%
pull(feature)
na_filter