1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Suy luận cho hồi quy tuyến tính trong R

Connected

Bài tập

Phân phối lấy mẫu của hệ số góc dưới giả thuyết không

Ở chương trước, bạn đã khảo sát phân phối lấy mẫu của hệ số góc từ một tổng thể có hệ số góc khác 0. Tuy nhiên, để suy luận thống kê, bạn thường cần biết phân phối lấy mẫu của hệ số góc dưới giả thuyết rằng không có mối quan hệ giữa biến giải thích và biến phản hồi. Thêm nữa, trong hầu hết tình huống, bạn không biết tổng thể mà dữ liệu xuất phát từ đó, nên phân phối lấy mẫu dưới giả thuyết không phải được suy ra chỉ từ chính bộ dữ liệu gốc.

Giữa thế kỷ 20, có một nghiên cứu lần theo các cặp sinh đôi cùng trứng bị tách ra từ lúc sinh: một trẻ được nuôi bởi cha mẹ ruột và trẻ còn lại trong gia đình nhận nuôi. Nhằm trả lời câu hỏi trí thông minh là do bẩm sinh hay do môi trường, cả hai trẻ đều được làm bài kiểm tra IQ. Dữ liệu thu được gồm IQ của các em sinh đôi được nuôi dưỡng trong gia đình nhận nuôi (Foster là biến phản hồi) và IQ của các em sinh đôi được nuôi bởi cha mẹ ruột (Biological là biến giải thích).

Trong bài tập này bạn sẽ dùng hàm pull(). Hàm này nhận một data frame và trả về một cột được chọn dưới dạng vector (tương tự như $).

Hướng dẫn 1/2

undefined XP
  • 1
    • Chạy hồi quy tuyến tính của Foster theo Biological trên bộ dữ liệu twins.
    • Dọn gọn (tidy) kết quả.
    • Lọc các dòng nơi term bằng "Biological".
    • Dùng pull() để lấy cột estimate.
  • 2

    Mô phỏng 10 hệ số góc.

    • Dùng specify() để đặc tả Foster theo Biological (cùng công thức như hồi quy tuyến tính).
    • Dùng hypothesize() để đặt giả thuyết null là "independence".
    • Dùng generate() để tạo 10 lần lặp (reps) với type là "permute".
    • Dùng calculate() để tính thống kê tóm tắt stat là "slope".