1. 학습
  2. /
  3. 강의
  4. /
  5. Nền tảng Suy luận trong Python

Connected

연습 문제

Phân tích dữ liệu lệch bằng phép kiểm hoán vị

Phép kiểm hoán vị hữu ích khi dữ liệu không thỏa các điều kiện của những phép kiểm định giả thuyết mà bạn đã biết. Trong bài tập này, bạn sẽ tự viết một phép kiểm hoán vị bằng gói statsmodels.

Bạn muốn so sánh số vòng gọi vốn trung bình giữa các công ty thuộc mảng analytics và các công ty được đầu tư mạo hiểm còn lại. Mặc dù bạn có thể muốn dùng t-test, nhưng bạn biết rằng số vòng gọi vốn không phân phối chuẩn. Thực tế, đa số công ty chỉ có một vòng, và số công ty có từ hai vòng trở lên giảm rất nhanh.

Những đối tượng sau đã được nạp sẵn:

  • analytics_df - Dữ liệu về tất cả công ty analytics
  • non_analytics_df - Dữ liệu về tất cả công ty không thuộc analytics

지침

100 XP
  • Định nghĩa một hàm thống kê nhận hai mẫu fundings_group_1 và fundings_group_2, trả về chênh lệch trung bình số funding_rounds.
  • Thực hiện phép kiểm hoán vị dùng cột funding_rounds từ mỗi bộ dữ liệu, hàm thống kê bạn đã định nghĩa, và 100 lần hoán vị.
  • In ra p-value thu được từ phép kiểm hoán vị.