1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Phát hiện ngoại lệ đa biến

100 người sống trong cùng một khu vực đã nộp yêu cầu bồi thường vì nhà của họ bị hư hại do mưa đá vào đêm Chủ nhật. Bộ dữ liệu hailinsurance có 100 quan sát và 2 biến. Cột thứ nhất là số tiền chi trả mà công ty bảo hiểm đã thanh toán cho mỗi khách hàng, còn cột thứ hai là giá nhà gần nhất.

Trong bài tập này, trước tiên bạn sẽ dùng các ước lượng cổ điển trên bộ dữ liệu. Sau đó, bạn sẽ so sánh kết quả với các ước lượng vững (robust).

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tính trung bình mẫu và ma trận hiệp phương sai mẫu cho cả hai biến.
  • Thêm một ellipsoid dung sai 97.5% sử dụng các ước lượng cổ điển này.