IniziaInizia gratis

Rilevamento di outlier multivariati

100 persone che vivono nella stessa zona hanno presentato una richiesta di risarcimento perché le loro case sono state danneggiate dalla grandine della tempesta di domenica notte. Il dataset hailinsurance contiene 100 osservazioni e 2 variabili. La prima colonna riporta i pagamenti effettuati dalla compagnia assicurativa a ciascun cliente, mentre la seconda colonna indica il prezzo più recente della casa.

In questo esercizio userai prima gli stimatori classici sul dataset. Confronterai poi i risultati con quelli degli stimatori robusti.

Questo esercizio fa parte del corso

Rilevamento delle frodi in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a scatterplot
plot(hailinsurance, xlab = "price house", ylab = "claim")

# Compute the sample mean and sample covariance matrix
clcenter <- colMeans(___)
clcov <- cov(___)

# Add 97.5% tolerance ellipsoid
rad <- sqrt(qchisq(___, ___))
ellipse(center = clcenter, shape = clcov, radius = rad,col = "blue", lty = 2)
Modifica ed esegui il codice