Detección de atípicos multivariantes
100 personas que viven en la misma zona han presentado una reclamación porque sus casas resultaron dañadas por el granizo de la tormenta del domingo por la noche. El conjunto de datos hailinsurance contiene 100 observaciones y 2 variables. La primera columna recoge los pagos realizados por la compañía de seguros a cada cliente, mientras que la segunda columna contiene el precio de vivienda más reciente.
En este ejercicio, primero vas a usar estimadores clásicos sobre el conjunto de datos. Después compararás los resultados con los de estimadores robustos.
Este ejercicio forma parte del curso
Detección de fraude en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a scatterplot
plot(hailinsurance, xlab = "price house", ylab = "claim")
# Compute the sample mean and sample covariance matrix
clcenter <- colMeans(___)
clcov <- cov(___)
# Add 97.5% tolerance ellipsoid
rad <- sqrt(qchisq(___, ___))
ellipse(center = clcenter, shape = clcov, radius = rad,col = "blue", lty = 2)