1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Suy luận trong Python

Connected

Bài tập

Kiểm tra tính chuẩn

Một bộ công cụ thống kê mạnh mẽ, bao gồm nhiều kiểm định giả thuyết phổ biến, dựa trên giả định rằng dữ liệu nền tuân theo phân phối chuẩn. Dù histogram có thể gợi ý dữ liệu xấp xỉ phân phối chuẩn hay không, các kiểm định giả thuyết khác nhau cho phép bạn kiểm tra trực tiếp giả định này. Hơn nữa, histogram rất nhạy với số lượng bins, đặc biệt khi cỡ mẫu nhỏ.

Trong bài tập này, bạn sẽ làm việc với dữ liệu lương của nhân viên Thành phố Austin trong salary_df. Cụ thể, bạn sẽ làm việc với các lính cứu hỏa gốc Hispanic. Bạn sẽ phân tích xem số năm làm việc của họ có xấp xỉ phân phối chuẩn hay không bằng kiểm định giả thuyết Anderson-Darling.

Hướng dẫn

100 XP
  • Vẽ histogram hiển thị Years of Employment của các nhân viên.
  • Thực hiện kiểm định Anderson-Darling cho tính chuẩn để xem Years of Employment có xấp xỉ phân phối chuẩn hay không.
  • Tìm các critical_values mà statistic của kiểm định lớn hơn.
  • In ra (các) significance_level tại đó giả thuyết không (null) sẽ bị bác bỏ.