1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce podvodů v R

Connected

Cvičení

Vícerozměrná detekce odlehlých hodnot

Sto osob žijících ve stejné oblasti podalo pojistnou událost, protože jejich domy poškodilo krupobití v nedělní noci. Datová sada hailinsurance obsahuje 100 pozorování a 2 proměnné. První sloupec obsahuje platby, které pojišťovna vyplatila jednotlivým zákazníkům, druhý sloupec pak aktuální cenu jejich domu.

V tomto cvičení nejprve použiješ klasické odhady na tuto datovou sadu a pak výsledky porovnáš s výsledky robustních odhadů.

Pokyny 1/2

undefined XP
    1
    2
  • Vypočítej výběrový průměr a výběrovou kovarianční matici obou proměnných.
  • Přidej 97,5% toleranční elipsoid s využitím těchto klasických odhadů.