Multivariate Ausreißererkennung
100 Personen aus derselben Gegend haben einen Schaden gemeldet, weil ihre Häuser durch Hagel vom Sturm in der Nacht auf Sonntag beschädigt wurden. Der Datensatz hailinsurance enthält 100 Beobachtungen und 2 Variablen. Die erste Spalte enthält die Auszahlungen der Versicherung an die einzelnen Kundinnen und Kunden, die zweite Spalte den jüngsten Hauspreis.
In dieser Übung verwendest du zunächst klassische Schätzer auf dem Datensatz. Danach vergleichst du die Ergebnisse mit denen robuster Schätzer.
Diese Übung ist Teil des Kurses
Fraud Detection in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a scatterplot
plot(hailinsurance, xlab = "price house", ylab = "claim")
# Compute the sample mean and sample covariance matrix
clcenter <- colMeans(___)
clcov <- cov(___)
# Add 97.5% tolerance ellipsoid
rad <- sqrt(qchisq(___, ___))
ellipse(center = clcenter, shape = clcov, radius = rad,col = "blue", lty = 2)