Inferensi dengan dan tanpa pencilan (randomisasi)
Dengan uji randomisasi, Anda dapat kembali menilai dampak sebuah pencilan terhadap kesimpulan inferensial dari model linear. Jalankan uji randomisasi pada data hypdata_out dua kali: sekali dengan nilai pencilan dan sekali tanpa pencilan tersebut. Perhatikan bahwa baris-baris kode yang diperluas menjelaskan dengan jelas langkah-langkah uji randomisasi.
Latihan ini adalah bagian dari kursus
Inferensi untuk Regresi Linear di R
Petunjuk latihan
Dengan menggunakan data frame hypdata_out (mengandung pencilan) dan hypdata_noout (pencilan dihapus), data frame perm_slope_out dan perm_slope_noout telah dibuat untuk menampung kemiringan hasil permutasi dari masing-masing himpunan data asli. Nilai teramati disimpan dalam variabel obs_slope_out dan obs_slope_noout.
- Temukan nilai p dengan mencari proporsi kemiringan hasil permutasi yang (bernilai
absolut) lebih besar atau sama dengan kemiringan teramati (yang juga bernilaiabsolut). Seperti sebelumnya, gunakanmeanpada pertidaksamaan biner untuk mendapatkan proporsinya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the p-value with the outlier
perm_slope_out %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)
# Calculate the p-value without the outlier
perm_slope_noout %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)