MulaiMulai sekarang secara gratis

Deteksi outlier multivariat

Sebanyak 100 orang yang tinggal di area yang sama mengajukan klaim karena rumah mereka rusak akibat hujan es pada Minggu malam. Himpunan data hailinsurance berisi 100 observasi dan 2 variabel. Kolom pertama berisi pembayaran yang dilakukan oleh perusahaan asuransi kepada setiap pelanggan, sedangkan kolom kedua adalah harga rumah terkini.

Dalam latihan ini, Anda terlebih dahulu akan menggunakan penaksir klasik pada himpunan data tersebut. Setelah itu, Anda akan membandingkan hasilnya dengan penaksir robust.

Latihan ini adalah bagian dari kursus

Deteksi Fraud di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a scatterplot
plot(hailinsurance, xlab = "price house", ylab = "claim")

# Compute the sample mean and sample covariance matrix
clcenter <- colMeans(___)
clcov <- cov(___)

# Add 97.5% tolerance ellipsoid
rad <- sqrt(qchisq(___, ___))
ellipse(center = clcenter, shape = clcov, radius = rad,col = "blue", lty = 2)
Edit dan Jalankan Kode