1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lấy mẫu trong R

Connected

Bài tập

Phân phối lấy mẫu vs. phân phối bootstrap

Phân phối lấy mẫu và phân phối bootstrap có liên hệ chặt chẽ. Trong những tình huống bạn có thể lấy mẫu lặp lại từ một quần thể (hiếm khi xảy ra) và khi bạn tìm hiểu về cả hai, sẽ hữu ích nếu tạo cả phân phối lấy mẫu và phân phối bootstrap, lần lượt, để xem chúng liên quan thế nào.

Ở đây, thống kê bạn quan tâm là giá trị trung bình popularity của các bài hát.

spotify_population (toàn bộ dữ liệu) và spotify_sample (chỉ 500 dòng đại diện cho một mẫu gốc) đã có sẵn; dplyr đã được nạp.

Hướng dẫn 1/2

undefined XP
  • 1
    • Tạo phân phối lấy mẫu với 2000 lần lặp.
    • Lấy mẫu 500 dòng từ quần thể không hoàn lại.
    • Tính thống kê quan tâm (giá trị trung bình popularity) trong cột mean_popularity.
    • Kéo (pull) thống kê ra để nó là một giá trị số đơn lẻ (không phải tibble).
  • 2
    • Tạo phân phối bootstrap với 2000 lần lặp.
    • Lấy mẫu 500 dòng từ mẫu có hoàn lại.
    • Tính thống kê quan tâm (giá trị trung bình popularity) trong cột mean_popularity.
    • Kéo (pull) thống kê ra để nó là một giá trị số đơn lẻ (không phải tibble).