1. Learn
  2. /
  3. Courses
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê bằng Python

Connected

Exercise

Độ nhạy với ngoại lệ (outlier)

Khi phân tích mối quan hệ giữa nhiều biến, hệ số tương quan là điểm khởi đầu rất tốt. Nhưng tương quan hoạt động ra sao với những bộ dữ liệu thú vị hơn? Nó chống chọi với các ngoại lệ (outliers) tốt đến mức nào?

Trong bài tập này, bạn sẽ vẽ và tính tương quan cho một bộ dữ liệu có ngoại lệ, sau đó loại bỏ ngoại lệ đó để xem điều gì thay đổi. Cuối cùng, bạn muốn đánh giá cách tương quan vận hành và rút ra kết luận về khi nào và ở đâu bạn nên dùng nó.

Một mẫu dữ liệu từ bộ tứ Anscombe nổi tiếng đã được nhập sẵn vào biến df, cùng với tất cả các gói đã dùng trước đó trong chương này.

Instructions 1/3

undefined XP
    1
    2
    3
  • Hiển thị biểu đồ tán xạ matplotlib của hai biến X và Y; để ý điểm ngoại lệ ở góc trên bên phải.