Buat filter nilai hilang
Filter varians nol hanya menghapus sebagian fitur berinformasi rendah. Fitur juga bisa mengandung sedikit atau bahkan tidak ada informasi karena memiliki banyak nilai hilang. Pada latihan ini, Anda akan membuat filter nilai hilang. Anda akan mengambil pendekatan ekstrem dengan menghapus fitur yang memiliki setidaknya satu nilai hilang, yang berarti Anda bisa saja menghapus fitur yang sebenarnya mengandung informasi penting.
house_sales_df tersedia di konsol dan paket tidyverse sudah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Buat filter nilai hilang menggunakan
summarize(),across(),sum(), danis.na()untuk menghapus fitur dengan nol atau lebih nilai hilang dan simpan dalamna_filter.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a missing values filter
___ <- ___ %>%
___(across(everything(), ~ ___)) %>%
pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>%
___(___ > ___) %>%
pull(feature)
na_filter