Detecção de outliers multivariados
100 pessoas que moram na mesma região fizeram um pedido de indenização porque suas casas foram danificadas por granizo na tempestade de domingo à noite. O conjunto de dados hailinsurance contém 100 observações e 2 variáveis. A primeira coluna traz os pagamentos feitos pela seguradora a cada cliente, enquanto a segunda coluna é o preço mais recente da casa.
Neste exercício, você vai primeiro usar estimadores clássicos no conjunto de dados. Em seguida, vai comparar os resultados com os de estimadores robustos.
Este exercício faz parte do curso
Detecção de Fraudes em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a scatterplot
plot(hailinsurance, xlab = "price house", ylab = "claim")
# Compute the sample mean and sample covariance matrix
clcenter <- colMeans(___)
clcov <- cov(___)
# Add 97.5% tolerance ellipsoid
rad <- sqrt(qchisq(___, ___))
ellipse(center = clcenter, shape = clcov, radius = rad,col = "blue", lty = 2)