Multivariate Ausreißererkennung
100 Personen aus derselben Gegend haben einen Schaden gemeldet, weil ihre Häuser durch Hagel vom Sturm in der Nacht auf Sonntag beschädigt wurden. Der Datensatz hailinsurance enthält 100 Beobachtungen und 2 Variablen. Die erste Spalte enthält die Auszahlungen der Versicherung an die einzelnen Kundinnen und Kunden, die zweite Spalte den jüngsten Hauspreis.
In dieser Übung verwendest du zunächst klassische Schätzer auf dem Datensatz. Danach vergleichst du die Ergebnisse mit denen robuster Schätzer.
Diese Übung ist Teil des Kurses
<Kurs>Fraud Detection in R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a scatterplot
plot(hailinsurance, xlab = "price house", ylab = "claim")
# Compute the sample mean and sample covariance matrix
clcenter <- colMeans(___)
clcov <- cov(___)
# Add 97.5% tolerance ellipsoid
rad <- sqrt(qchisq(___, ___))
ellipse(center = clcenter, shape = clcov, radius = rad,col = "blue", lty = 2)