1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Trực quan hóa các mẫu bootstrap

Trong bài tập này, bạn sẽ tạo các mẫu bootstrap từ bộ dữ liệu lượng mưa hằng năm đo tại Trạm Thời tiết Sheffield (Vương quốc Anh) từ năm 1883 đến 2015. Dữ liệu được lưu trong mảng NumPy rainfall với đơn vị milimét (mm). Bằng cách hiển thị đồ họa các mẫu bootstrap bằng ECDF, bạn sẽ cảm nhận được cách lấy mẫu bootstrap cho phép mô tả xác suất của dữ liệu.

Hướng dẫn

100 XP
  • Viết một vòng lặp for để lấy 50 mẫu bootstrap của dữ liệu lượng mưa và vẽ ECDF của chúng.
    • Dùng np.random.choice() để tạo một mẫu bootstrap từ mảng NumPy rainfall. Hãy đảm bảo size của mảng lấy mẫu lại là len(rainfall).
    • Dùng hàm ecdf() mà bạn đã viết ở phần trước của khóa học để tạo các giá trị x và y cho ECDF của mẫu bootstrap bs_sample.
    • Vẽ các giá trị ECDF. Chỉ định thêm color='gray' (để có các chấm màu xám) và alpha=0.1 (để chúng bán trong suốt, vì chúng ta chồng rất nhiều đường) bên cạnh các đối số từ khóa marker='.' và linestyle='none'.
  • Dùng ecdf() để tạo các giá trị x và y cho ECDF của dữ liệu lượng mưa gốc trong mảng rainfall.
  • Vẽ các giá trị ECDF của dữ liệu gốc.
  • Nhấn Gửi để trực quan hóa các mẫu!