Menangani Nilai Ujian yang Hilang
Jika kita ingin menggunakan nilai SAT sebagai keluaran, kita perlu menelaah data yang hilang. Periksa pola kelengkapan data di seluruh variabel dalam nyc_scores menggunakan miss_var_summary() dari paket naniar. naniar terintegrasi dengan gaya kode Tidyverse, termasuk operator pipe (%>%).
Terdapat 60 nilai yang hilang pada setiap mata pelajaran. Meskipun ada banyak paket R yang membantu imputasi tingkat lanjut, seperti MICE, Amelia, dan mi, kita akan tetap menggunakan simputation dan impute_median().
Buat himpunan data baru, nyc_scores_2, dengan mengimputasi nilai Math berdasarkan Borough, namun perhatikan bahwa impute_median() mengembalikan variabel hasil imputasi bertipe "impute". Anda akan mengonversi variabel tersebut menjadi numerik pada langkah terpisah.
simputation dan dplyr sudah dimuat.
Latihan ini adalah bagian dari kursus
Perancangan Eksperimen di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load naniar
___
# Examine missingness with miss_var_summary()
___