MulaiMulai sekarang secara gratis

Box plot untuk pencilan

Selain menunjukkan titik tengah dan sebaran suatu distribusi, box plot menyediakan cara grafis untuk mendeteksi pencilan. Anda dapat menerapkan metode ini pada kolom msrp (manufacturer's suggested retail price/harga eceran yang disarankan pabrikan) untuk mendeteksi apakah ada mobil yang harganya sangat mahal atau sangat murah.

Latihan ini adalah bagian dari kursus

Analisis Data Eksploratori dengan R

Lihat Kursus

Petunjuk latihan

  • Buat box plot untuk msrp.
  • Kecualikan 3–5 pencilan terbesar dengan memfilter baris agar hanya menyisakan mobil dengan harga kurang dari $100.000. Simpan himpunan data yang telah diperkecil ini sebagai cars_no_out.
  • Buat box plot serupa untuk msrp menggunakan himpunan data yang telah diperkecil ini. Bandingkan kedua plot tersebut.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Construct box plot of msrp
cars %>%
  ggplot(aes(x = 1, y = ___)) +
  geom_boxplot()

# Exclude outliers from data
cars_no_out <- cars %>%
  filter(___)

# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
  ___ +
  ___
Edit dan Jalankan Kode