1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô phỏng Thống kê bằng Python

Connected

Bài tập

Bộ ước lượng phi tiêu chuẩn

Trong bài tập trước, bạn đã chạy một bootstrap đơn giản mà giờ chúng ta sẽ điều chỉnh cho các bộ ước lượng phức tạp hơn.

Giả sử bạn đang nghiên cứu sức khỏe của học sinh. Bạn có số đo chiều cao và cân nặng của 1000 học sinh và bạn quan tâm đến trung vị chiều cao cũng như tương quan giữa chiều cao và cân nặng, kèm theo khoảng tin cậy 95% cho các đại lượng này. Hãy dùng bootstrapping.

Xem pandas DataFrame df với chiều cao và cân nặng của 1000 học sinh. Từ đó, hãy tính khoảng tin cậy 95% cho cả trung vị chiều cao và tương quan giữa chiều cao và cân nặng.

Hướng dẫn

100 XP
  • Dùng phương thức .sample() trên df để tạo một mẫu dữ liệu có hoàn lại và gán vào tmp_df.
  • Với mỗi bộ dữ liệu sinh ra trong tmp_df, tính trung vị chiều cao và tương quan giữa chiều cao với cân nặng bằng .median() và .corr().
  • Thêm trung vị chiều cao vào height_medians và hệ số tương quan vào hw_corr.
  • Cuối cùng, tính khoảng tin cậy 95% ([2.5, 97.5]) cho từng đại lượng trên bằng np.percentile().