1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lấy mẫu trong R

Connected

Bài tập

Tạo một phân phối bootstrap

Quy trình tạo một phân phối bootstrap rất giống với quy trình tạo một phân phối lấy mẫu; chỉ khác ở bước đầu tiên.

Để tạo phân phối lấy mẫu, bạn bắt đầu từ tổng thể và lấy mẫu không hoàn lại. Để tạo phân phối bootstrap, bạn bắt đầu từ một mẫu và lấy mẫu có hoàn lại trên chính mẫu đó. Sau đó, các bước đều giống nhau: tính thống kê tóm tắt mà bạn quan tâm trên mẫu/tái mẫu, rồi lặp lại quy trình nhiều lần. Ở cả hai trường hợp, bạn có thể trực quan hóa phân phối bằng biểu đồ histogram.

Ở đây, spotify_sample là một tập con của dữ liệu spotify_population. Để bạn dễ quan sát cách tái mẫu hoạt động, đã thêm một cột mã hàng (row ID), và chỉ giữ tên nghệ sĩ, tên bài hát và cột danceability.

spotify_sample đã sẵn có; dplyr và ggplot2 đã được nạp.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4

Tạo một tái mẫu bootstrap đơn từ spotify_sample.