MulaiMulai sekarang secara gratis

EDA NHANES

Mari kita telaah himpunan data yang baru kita susun dengan fokus pada EDA. Seperti pada bab sebelumnya, sebaiknya Anda melihat baik ringkasan numerik maupun visualisasi. Keduanya membantu memahami data dan merupakan cara yang baik untuk menemukan langkah pembersihan data yang mungkin terlewat. Himpunan data nhanes_combined telah dimuat sebelumnya untuk Anda.

Misalkan kita memiliki akses ke pasien NHANES dan ingin melakukan studi tentang pengaruh diberi tahu oleh dokter untuk mengurangi kalori/lemak dalam diet terhadap berat badan. Ini adalah perlakuan kita; kita berasumsi bahwa alih-alih ini berupa pertanyaan yang diajukan kepada pasien, kita secara acak meminta dokter memberi konseling nutrisi kepada sebagian pasien. Namun, kita curiga bahwa mungkin ada perbedaan berat badan berdasarkan jenis kelamin pasien — suatu faktor pemblokiran!

Latihan ini adalah bagian dari kursus

Perancangan Eksperimen di R

Lihat Kursus

Petunjuk latihan

  • Lengkapi dan jalankan kode dplyr untuk mencari rerata berat badan (bmxwt) dalam kg berdasarkan perlakuan kita (mcq365d). Adakah hal menarik tentang pasien dengan perlakuan NA?
  • Lengkapi kode ggplot2 untuk melihat boxplot IQR berat badan pasien menurut variabel perlakuan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fill in the dplyr code
___ %>% 
  group_by(___) %>% 
  summarize(mean = mean(___, na.rm = TRUE))

# Fill in the ggplot2 code
___ %>% 
  ggplot(aes(as.factor(___), ___)) +
  geom_boxplot() +
  labs(x = "Treatment",
       y = "Weight")
Edit dan Jalankan Kode