Ada berapa nilai hilang?
Salah satu hal pertama yang perlu Anda periksa pada himpunan data baru adalah apakah ada nilai hilang, dan berapa banyak jumlahnya.
Anda dapat menggunakan are_na() lalu menghitung jumlah nilai hilang, tetapi cara paling efisien untuk menghitung nilai hilang adalah menggunakan fungsi n_miss(). Ini akan memberi tahu Anda total jumlah nilai hilang dalam data.
Anda kemudian dapat mengetahui persentase nilai hilang dalam data dengan fungsi pct_miss. Ini akan memberi tahu Anda persentase nilai hilang dalam data.
Anda juga dapat mencari komplemennya — berapa banyak nilai yang lengkap — menggunakan n_complete dan pct_complete.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Dengan menggunakan dataframe contoh tinggi dan berat dat_hw:
- Gunakan
n_miss()pada dataframedat_hwuntuk menghitung total jumlah nilai hilang pada dataframe tersebut. - Gunakan
n_miss()pada variabeldat_hw$weightuntuk menghitung total jumlah nilai hilang pada variabel tersebut. - Dengan cara serupa, gunakan
prop_miss(),n_complete(), danprop_complete()untuk mendapatkan proporsi nilai hilang, serta jumlah dan proporsi nilai lengkap untuk dataframe dan variabel.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use n_miss() to count the total number of missing values in dat_hw
n_miss(___)
# Use n_miss() on dat_hw$weight to count the total number of missing values
n_miss(___$___)
# Use n_complete() on dat_hw to count the total number of complete values
n_complete(___)
# Use n_complete() on dat_hw$weight to count the total number of complete values
___(___$___)
# Use prop_miss() and prop_complete() on dat_hw to count the total number of missing values in each of the variables
prop_miss(____)
prop_complete(___)