Mulai sekarangMulai gratis

Box plot untuk pencilan

Selain menunjukkan titik tengah dan sebaran suatu distribusi, box plot menyediakan cara grafis untuk mendeteksi pencilan. Anda dapat menerapkan metode ini pada kolom msrp (manufacturer's suggested retail price/harga eceran yang disarankan pabrikan) untuk mendeteksi apakah ada mobil yang harganya sangat mahal atau sangat murah.

Latihan ini merupakan bagian dari kursus

Analisis Data Eksploratori dengan R

Lihat Kursus

Instruksi latihan

  • Buat box plot untuk msrp.
  • Kecualikan 3–5 pencilan terbesar dengan memfilter baris agar hanya menyisakan mobil dengan harga kurang dari $100.000. Simpan himpunan data yang telah diperkecil ini sebagai cars_no_out.
  • Buat box plot serupa untuk msrp menggunakan himpunan data yang telah diperkecil ini. Bandingkan kedua plot tersebut.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Construct box plot of msrp
cars %>%
  ggplot(aes(x = 1, y = ___)) +
  geom_boxplot()

# Exclude outliers from data
cars_no_out <- cars %>%
  filter(___)

# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
  ___ +
  ___
Edit dan Jalankan Kode