MulaiMulai sekarang secara gratis

Menangani Nilai Ujian yang Hilang

Jika kita ingin menggunakan nilai SAT sebagai keluaran, kita perlu menelaah data yang hilang. Periksa pola kelengkapan data di seluruh variabel dalam nyc_scores menggunakan miss_var_summary() dari paket naniar. naniar terintegrasi dengan gaya kode Tidyverse, termasuk operator pipe (%>%).

Terdapat 60 nilai yang hilang pada setiap mata pelajaran. Meskipun ada banyak paket R yang membantu imputasi tingkat lanjut, seperti MICE, Amelia, dan mi, kita akan tetap menggunakan simputation dan impute_median().

Buat himpunan data baru, nyc_scores_2, dengan mengimputasi nilai Math berdasarkan Borough, namun perhatikan bahwa impute_median() mengembalikan variabel hasil imputasi bertipe "impute". Anda akan mengonversi variabel tersebut menjadi numerik pada langkah terpisah.

simputation dan dplyr sudah dimuat.

Latihan ini adalah bagian dari kursus

Perancangan Eksperimen di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load naniar
___

# Examine missingness with miss_var_summary()
___
Edit dan Jalankan Kode