Buat filter rasio nilai hilang
Data frame house_sales_df berisi variabel target price dan berbagai prediktor yang menggambarkan masing-masing rumah serta menentukan harga jualnya. Beberapa fitur memiliki jumlah nilai hilang yang bervariasi. Jika rasio nilai hilang terlalu tinggi, maka fitur tersebut tidak akan terlalu informatif untuk memprediksi harga rumah. Fitur-fitur seperti ini dapat dihapus. Pada latihan ini, Anda akan menghitung rasio nilai hilang untuk setiap kolom. Ini akan membantu Anda mempertimbangkan ambang batas yang sesuai untuk setiap kolom.
Paket tidyverse telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Simpan jumlah total baris dalam
house_sales_dfke dalamn. - Hitung rasio nilai hilang untuk setiap kolom di
house_sales_dfdan simpan dalammissing_vals_df.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate total rows
___ <- ___(___)
# Calculate missing value ratios
___ <- ___ %>%
___(___(___(), ~ ___(___(.)))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>%
mutate(missing_val_ratio = ___ / ___)
# Display missing value ratios
missing_vals_df