Menggunakan stat_sum
Dalam himpunan data Vocab, education dan vocabulary adalah variabel bertipe integer. Pada kursus pertama, Anda melihat bahwa ini adalah salah satu dari empat penyebab overplotting. Anda akan mendapatkan satu titik di setiap perpotongan antara kedua variabel.
Salah satu solusi, ditunjukkan pada langkah 1, adalah jitter dengan transparansi. Solusi lainnya adalah menggunakan stat_sum(), yang menghitung total jumlah pengamatan yang tumpang tindih dan memetakkannya ke estetika size.
stat_sum() memungkinkan variabel khusus, ..prop.., untuk menampilkan proporsi nilai dalam himpunan data.
Latihan ini adalah bagian dari kursus
Visualisasi Data Tingkat Menengah dengan ggplot2
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
# Replace this with a sum stat
geom_jitter(alpha = 0.25)