Sebaran sampling nol untuk kemiringan (slope)
Pada bab sebelumnya, Anda menelusuri sebaran sampling dari kemiringan (slope) pada populasi dengan slope yang tidak nol. Namun, untuk melakukan inferensi, umumnya Anda perlu mengetahui sebaran sampling dari slope di bawah hipotesis bahwa tidak ada hubungan antara variabel penjelas dan variabel respons. Selain itu, dalam banyak situasi, Anda tidak mengetahui populasi asal data, sehingga sebaran sampling nol harus diturunkan hanya dari himpunan data asli.
Pada pertengahan abad ke-20, dilakukan sebuah studi yang melacak anak kembar identik yang dipisahkan saat lahir: satu anak dibesarkan oleh orang tua kandungnya dan yang lain di keluarga asuh. Untuk mencoba menjawab apakah kecerdasan dipengaruhi oleh faktor bawaan atau lingkungan, kedua anak tersebut diberikan tes IQ. Data yang dihasilkan memuat IQ kembar asuh (Foster adalah variabel respons) dan IQ kembar biologis (Biological adalah variabel penjelas).
Dalam latihan ini Anda akan menggunakan fungsi pull(). Fungsi ini menerima sebuah data frame dan mengembalikan kolom terpilih sebagai vektor (mirip dengan $).
Latihan ini adalah bagian dari kursus
Inferensi untuk Regresi Linear di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(infer)
# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
# Tidy the result
___() %>%
# Filter for rows where term equal Biological
___(___) %>%
# Pull out the estimate column
___(___)
# See the result
obs_slope