MulaiMulai sekarang secara gratis

Overplotting 1: himpunan data besar

Scatter plot (menggunakan geom_point()) bersifat intuitif, mudah dipahami, dan sangat umum, tetapi kita harus selalu mempertimbangkan overplotting, khususnya pada empat situasi berikut:

  1. Himpunan data besar
  2. Nilai yang sejajar pada satu sumbu
  3. Data berpresisi rendah
  4. Data bertipe integer

Biasanya, alpha blending (yakni menambahkan transparansi) direkomendasikan saat menggunakan bentuk solid. Alternatifnya, Anda dapat menggunakan bentuk kosong yang buram (opaque).

Titik berukuran kecil cocok untuk himpunan data besar dengan wilayah berdensitas tinggi (banyak tumpang tindih).

Mari gunakan himpunan data diamonds untuk berlatih menangani kasus himpunan data besar.

Latihan ini adalah bagian dari kursus

Pengantar Visualisasi Data dengan ggplot2

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))

# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___
Edit dan Jalankan Kode