1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Suy luận cho dữ liệu phân loại trong R

Connected

Bài tập

SE với ít dữ liệu hơn

Bạn có càng ít dữ liệu để ước lượng, mức độ bất định trong ước lượng đó càng cao. Điều này thể hiện qua sai số chuẩn (standard error). Trong bài tập này, bạn sẽ cảm nhận mối quan hệ đó bằng cách xem các tập dữ liệu có kích thước khác nhau.

Hai tập dữ liệu nhỏ hơn đã được tạo sẵn từ gss2016: gss2016_small chứa 50 quan sát và gss2016_smaller chỉ chứa 10 quan sát.

Hướng dẫn 1/4

undefined XP
  • 1
    • Dùng gss2016_small, tạo một phân phối bootstrap tên boot_dist_small theo các bước quen thuộc:
    • specify biến bạn quan tâm là consci với thành công được xác định bởi mức tự tin "High".
    • generate 500 bản sao bootstrap.
    • calculate tỷ lệ prop cho mỗi bản sao.
  • 2

    Tóm tắt SE của boot_dist_small bằng độ lệch chuẩn của nó, sau đó pull ra và lưu vào SE_small_n.

  • 3
    • Lặp lại quy trình tạo phân phối bootstrap cho gss2016_smaller và lưu vào boot_dist_smaller. Tiết kiệm thời gian bằng cách sao chép và dán khối mã trước đó rồi thay tên tập dữ liệu.
  • 4
    • Lặp lại quy trình trích xuất SE của boot_dist_smaller và lưu vào SE_smaller_n. Sao chép và dán lại rất hữu ích ở đây.
    • Chạy mã để so sánh hai SE và kích thước mẫu tương ứng. Kích thước mẫu ảnh hưởng tới sai số chuẩn như thế nào?