Overplotting 1: himpunan data besar
Scatter plot (menggunakan geom_point()) bersifat intuitif, mudah dipahami, dan sangat umum, tetapi kita harus selalu mempertimbangkan overplotting, khususnya pada empat situasi berikut:
- Himpunan data besar
- Nilai yang sejajar pada satu sumbu
- Data berpresisi rendah
- Data bertipe integer
Biasanya, alpha blending (yakni menambahkan transparansi) direkomendasikan saat menggunakan bentuk solid. Alternatifnya, Anda dapat menggunakan bentuk kosong yang buram (opaque).
Titik berukuran kecil cocok untuk himpunan data besar dengan wilayah berdensitas tinggi (banyak tumpang tindih).
Mari gunakan himpunan data diamonds untuk berlatih menangani kasus himpunan data besar.
Latihan ini merupakan bagian dari kursus
Pengantar Visualisasi Data dengan ggplot2
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))
# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___