1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kiểm định giả thuyết trong Python

Connected

Bài tập

Sử dụng ttest()

Tự tính thống kê kiểm định và chuyển đổi bằng CDF để lấy p-value là khá tốn công khi bạn chỉ muốn so sánh hai trung bình mẫu. Việc so sánh hai trung bình mẫu gọi là t-test, và gói Python pingouin có phương thức .ttest() để thực hiện. Phương thức này cho bạn một số linh hoạt trong cách triển khai kiểm định.

Như ở bài tập trước, bạn sẽ khám phá sự khác biệt giữa tỷ lệ phiếu bầu cấp quận cho ứng viên Đảng Dân chủ năm 2012 và 2016 để xem khác biệt đó có ý nghĩa thống kê hay không. Giả thuyết như sau:

\(H_{0}\): Tỷ lệ phiếu cho Đảng Dân chủ năm 2012 và 2016 là như nhau. \(H_{A}\): Tỷ lệ phiếu cho Đảng Dân chủ năm 2012 và 2016 là khác nhau.

sample_dem_data đã được cung cấp với các cột diff, dem_percent_12, và dem_percent_16 cùng với tên state và county. pingouin đã được nạp cùng với pandas là pd.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Thực hiện t-test trên các sai khác mẫu (cột diff của sample_dem_data), dùng giả thuyết đối thay phù hợp, chọn từ "two-sided", "less", và "greater".