Overplotting 1: himpunan data besar
Scatter plot (menggunakan geom_point()) bersifat intuitif, mudah dipahami, dan sangat umum, tetapi kita harus selalu mempertimbangkan overplotting, khususnya pada empat situasi berikut:
- Himpunan data besar
- Nilai yang sejajar pada satu sumbu
- Data berpresisi rendah
- Data bertipe integer
Biasanya, alpha blending (yakni menambahkan transparansi) direkomendasikan saat menggunakan bentuk solid. Alternatifnya, Anda dapat menggunakan bentuk kosong yang buram (opaque).
Titik berukuran kecil cocok untuk himpunan data besar dengan wilayah berdensitas tinggi (banyak tumpang tindih).
Mari gunakan himpunan data diamonds untuk berlatih menangani kasus himpunan data besar.
Latihan ini adalah bagian dari kursus
Pengantar Visualisasi Data dengan ggplot2
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))
# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___