1. Learn
  2. /
  3. Courses
  4. /
  5. Giới thiệu trực quan dữ liệu với Seaborn

Connected

Exercise

Bỏ qua các điểm ngoại lệ

Bây giờ hãy dùng bộ dữ liệu student_data để so sánh phân phối điểm cuối kỳ ("G3") giữa những học sinh có Internet tại nhà và những học sinh không có. Để làm điều này, chúng ta sẽ dùng biến "internet", đây là biến nhị phân (có/không) cho biết học sinh có truy cập Internet tại nhà hay không.

Vì Internet có thể ít phổ biến hơn ở khu vực nông thôn, chúng ta sẽ thêm các nhóm con dựa trên nơi học sinh sinh sống. Cho mục đích này, ta có thể dùng biến "location", biến này cho biết học sinh sống ở khu vực đô thị ("Urban") hay nông thôn ("Rural").

Seaborn đã được nhập với tên sns và matplotlib.pyplot đã được nhập là plt. Nhắc lại, bạn có thể bỏ qua các điểm ngoại lệ trong box plot bằng cách đặt showfliers=False.

Instructions

100 XP
  • Dùng sns.catplot() để tạo box plot với DataFrame student_data, đặt "internet" trên trục x và "G3" trên trục y.
  • Thêm các nhóm con để mỗi box plot được tô màu theo "location".
  • Không hiển thị các điểm ngoại lệ.