1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Trực quan hóa lấy mẫu hoán vị

Để hiểu trực quan cách lấy mẫu hoán vị hoạt động, trong bài này bạn sẽ tạo các mẫu hoán vị và quan sát chúng bằng đồ thị.

Ta sẽ tiếp tục dùng dữ liệu Trạm Thời tiết Sheffield, lần này xét lượng mưa theo tháng vào tháng 6 (tháng khô) và tháng 11 (tháng ẩm). Ta kỳ vọng hai phân phối này có thể khác nhau, nên sẽ lấy các mẫu hoán vị để xem các ECDF của chúng sẽ trông như thế nào nếu chúng có cùng phân phối.

Dữ liệu được lưu trong các mảng NumPy rain_june và rain_november.

Nhắc lại, permutation_sample() có chữ ký hàm permutation_sample(data_1, data_2) và trả về permuted_data[:len(data_1)], permuted_data[len(data_1):], trong đó permuted_data = np.random.permutation(np.concatenate((data_1, data_2))).

Hướng dẫn

100 XP
  • Viết một vòng lặp for để tạo 50 mẫu hoán vị, tính ECDF của chúng và vẽ đồ thị.
    • Tạo một cặp mẫu hoán vị từ rain_june và rain_november bằng hàm permutation_sample() của bạn.
    • Tạo các giá trị x và y cho một ECDF cho từng mẫu hoán vị bằng hàm ecdf() của bạn.
    • Vẽ ECDF của mẫu hoán vị thứ nhất (x_1 và y_1) bằng các điểm. Làm tương tự cho mẫu hoán vị thứ hai (x_2 và y_2).
  • Tạo các giá trị x và y cho ECDF của dữ liệu rain_june và rain_november và vẽ các ECDF này lần lượt với đối số từ khóa color='red' và color='blue'.
  • Gắn nhãn trục, đặt lề 2% và hiển thị biểu đồ. Phần này đã được làm sẵn, nên bạn chỉ cần bấm gửi để xem biểu đồ!