Menumpangtindihkan garis
Melanjutkan dari latihan sebelumnya, Anda kini akan mengulangi proses pengambilan sampel sebanyak 100 kali untuk memvisualisasikan sebaran sampling dari garis regresi yang dihasilkan oleh 100 sampel acak berbeda dari populasi.
Alih-alih berulang kali memanggil sample_n() seperti pada latihan sebelumnya, rep_sample_n() dari paket oilabs menyediakan cara yang mudah untuk menghasilkan banyak sampel acak. Fungsi rep_sample_n() mengulangi perintah sample_n() sebanyak nilai reps.
Fungsi do() dari dplyr memungkinkan Anda menjalankan pemanggilan lm secara terpisah untuk setiap tingkat dari variabel yang telah di-group_by. Di sini, variabel pengelompokan adalah replikasi sampling, sehingga setiap lm dijalankan pada sampel acak data yang berbeda.
Latihan ini adalah bagian dari kursus
Inferensi untuk Regresi Linear di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set the seed for reproducibility
set.seed(4747)
# Repeatedly sample the population without replacement
many_samples <- popdata %>%
___
# See the result
glimpse(many_samples)