1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Tương tự: thời gian trên website

Hóa ra bạn đã từng thực hiện một kiểm định giả thuyết tương tự A/B test, nơi bạn quan tâm đến thời gian người dùng ở trên website trước và sau một chiến dịch quảng cáo. Lực lưỡi ếch (một đại lượng liên tục như thời gian trên website) là một phép tương tự. "Trước" = Ếch A và "sau" = Ếch B. Hãy luyện tập lại với một tình huống thật sự là trước/sau.

Quay lại bộ dữ liệu no-hitter. Năm 1920, Major League Baseball áp dụng các thay đổi luật quan trọng, chấm dứt cái gọi là kỷ nguyên dead ball. Đáng chú ý, pitcher (người ném bóng) không còn được phép nhổ nước bọt lên bóng hoặc làm xước bóng, hoạt động vốn rất có lợi cho pitcher. Trong bài này, bạn sẽ thực hiện một A/B test để xác định liệu các thay đổi luật này có dẫn đến tốc độ xuất hiện no-hitter chậm hơn hay không (tức là thời gian trung bình giữa các no-hitter dài hơn), dùng chênh lệch về thời gian trung bình giữa các no-hitter làm thống kê kiểm định. Thời gian giữa các no-hitter cho từng giai đoạn được lưu trong các mảng nht_dead và nht_live, trong đó "nht" viết tắt cho "no-hitter time" (thời gian no-hitter).

Vì bạn sẽ dùng hàm draw_perm_reps() trong bài này, có thể bạn muốn nhắc lại chữ ký lời gọi của nó: draw_perm_reps(d1, d2, func, size=1) hoặc thậm chí xem lại bài tập chương 3 nơi bạn đã định nghĩa hàm này.

Hướng dẫn

100 XP
  • Tính chênh lệch quan sát được của thời gian trung bình giữa các no-hitter bằng diff_of_means().
  • Sinh 10.000 bản lặp hoán vị của chênh lệch trung bình bằng draw_perm_reps().
  • Tính và in ra p-value.