Visualisasi Data Skor SAT NYC
Pada pelajaran sebelumnya, saat membahas Latin Squares, kita melakukan EDA numerik dengan melihat mean, varians, dan median skor SAT matematika. Bagian penting lain dari EDA adalah visualisasi data, karena sering membantu menemukan outlier dan memberikan representasi visual dari sebaran variabel Anda.
ggplot2 telah dimuat untuk Anda dan himpunan data nyc_scores tersedia. Buat dan telaah boxplot yang diminta. Bagaimana perbedaan median antar Borough? Berapa banyak outlier yang ada, dan di mana paling banyak muncul?
Latihan ini adalah bagian dari kursus
Perancangan Eksperimen di R
Petunjuk latihan
- Buat boxplot skor SAT Matematika berdasarkan
Borough. - Jalankan kode untuk menyertakan judul:
"Average SAT Math Scores by Borough, NYC". - Ubah label sumbu x dan y menjadi
"Borough (NYC)"dan"Average SAT Math Scores (2014-15)", masing-masing, menggunakan argumen yang benar padalabs().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
___ +
labs(title = "Average SAT Math Scores by Borough, NYC",
___,
___)