1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô phỏng Thống kê bằng Python

Connected

Bài tập

Chạy một bootstrap đơn giản

Chào mừng bạn đến với bài tập đầu tiên trong phần bootstrapping. Chúng ta sẽ cùng làm một ví dụ để học cách chạy một bootstrap đơn giản. Như bạn đã thấy trong video, ý tưởng chính của bootstrapping là lấy mẫu có hoàn lại (sampling with replacement).

Giả sử bạn sở hữu một nhà máy sản xuất cờ-lê (wrench). Bạn muốn mô tả được chiều dài trung bình của cờ-lê và đảm bảo chúng đáp ứng các thông số kỹ thuật. Nhà máy sản xuất hàng nghìn chiếc mỗi ngày, nên việc đo chiều dài từng chiếc là bất khả thi. Tuy nhiên, bạn có một mẫu đại diện gồm 100 chiếc cờ-lê. Hãy dùng bootstrapping để ước lượng khoảng tin cậy 95% (CI) cho chiều dài trung bình.

Hãy xem danh sách wrench_lengths, trong đó có 100 số đo chiều dài cờ-lê đã quan sát, trong shell.

Hướng dẫn

100 XP
  • Rút ngẫu nhiên một mẫu có hoàn lại từ wrench_lengths và lưu vào temp_sample. Đặt size = len(wrench_lengths).
  • Tính chiều dài trung bình của mỗi mẫu, gán vào sample_mean, rồi thêm nó vào mean_lengths.
  • Tính trung bình bootstrap (boot_mean) và khoảng tin cậy 95% bootstrap (boot_95_ci) bằng cách dùng np.percentile().