LoslegenKostenlos loslegen

Multivariate Ausreißererkennung

100 Personen aus derselben Gegend haben einen Schaden gemeldet, weil ihre Häuser durch Hagel vom Sturm in der Nacht auf Sonntag beschädigt wurden. Der Datensatz hailinsurance enthält 100 Beobachtungen und 2 Variablen. Die erste Spalte enthält die Auszahlungen der Versicherung an die einzelnen Kundinnen und Kunden, die zweite Spalte den jüngsten Hauspreis.

In dieser Übung verwendest du zunächst klassische Schätzer auf dem Datensatz. Danach vergleichst du die Ergebnisse mit denen robuster Schätzer.

Diese Übung ist Teil des Kurses

Fraud Detection in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a scatterplot
plot(hailinsurance, xlab = "price house", ylab = "claim")

# Compute the sample mean and sample covariance matrix
clcenter <- colMeans(___)
clcov <- cov(___)

# Add 97.5% tolerance ellipsoid
rad <- sqrt(qchisq(___, ___))
ellipse(center = clcenter, shape = clcov, radius = rad,col = "blue", lty = 2)
Code bearbeiten und ausführen