Box plot untuk pencilan
Selain menunjukkan titik tengah dan sebaran suatu distribusi, box plot menyediakan cara grafis untuk mendeteksi pencilan. Anda dapat menerapkan metode ini pada kolom msrp (manufacturer's suggested retail price/harga eceran yang disarankan pabrikan) untuk mendeteksi apakah ada mobil yang harganya sangat mahal atau sangat murah.
Latihan ini adalah bagian dari kursus
Analisis Data Eksploratori dengan R
Petunjuk latihan
- Buat box plot untuk
msrp. - Kecualikan 3–5 pencilan terbesar dengan memfilter baris agar hanya menyisakan mobil dengan harga kurang dari $100.000. Simpan himpunan data yang telah diperkecil ini sebagai
cars_no_out. - Buat box plot serupa untuk
msrpmenggunakan himpunan data yang telah diperkecil ini. Bandingkan kedua plot tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Construct box plot of msrp
cars %>%
ggplot(aes(x = 1, y = ___)) +
geom_boxplot()
# Exclude outliers from data
cars_no_out <- cars %>%
filter(___)
# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
___ +
___