MulaiMulai sekarang secara gratis

Menggunakan stat_sum

Dalam himpunan data Vocab, education dan vocabulary adalah variabel bertipe integer. Pada kursus pertama, Anda melihat bahwa ini adalah salah satu dari empat penyebab overplotting. Anda akan mendapatkan satu titik di setiap perpotongan antara kedua variabel.

Salah satu solusi, ditunjukkan pada langkah 1, adalah jitter dengan transparansi. Solusi lainnya adalah menggunakan stat_sum(), yang menghitung total jumlah pengamatan yang tumpang tindih dan memetakkannya ke estetika size.

stat_sum() memungkinkan variabel khusus, ..prop.., untuk menampilkan proporsi nilai dalam himpunan data.

Latihan ini adalah bagian dari kursus

Visualisasi Data Tingkat Menengah dengan ggplot2

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Edit dan Jalankan Kode