1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Suy luận trong Python

Connected

Bài tập

So sánh trung vị

Các kiểm định tham số thường so sánh trung bình, còn các kiểm định phi tham số thường so sánh trung vị. Lý do là nếu dữ liệu bị lệch, trung bình có thể không phản ánh tốt xu hướng trung tâm, và bạn nên làm việc với trung vị.

Mỗi tổ chức xếp hạng đại học mà bạn vừa xem cũng có "tổng điểm" cho từng trường. Bạn sẽ bắt đầu bằng cách kiểm tra xem các điểm số có xấp xỉ phân phối chuẩn không bằng biểu đồ tần suất (histogram). Nếu không, bạn sẽ thực hiện kiểm định trung vị của Mood để so sánh trung vị của chúng. Trong bài này bạn sẽ làm việc với bảng xếp hạng đại học của CW và ARW.

Như trước đó, dù có nhiều cách để vẽ biểu đồ tần suất, bạn sẽ luyện tập dùng phương thức .hist() như trước.

Một DataFrame chứa ba bộ xếp hạng này có sẵn trong rankings_df. Các gói pandas là pd, NumPy là np, Matplotlib.pyplot là plt, và gói stats từ SciPy đã được nạp sẵn cho bạn.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Vẽ biểu đồ tần suất cho cột cw_score.