MulaiMulai sekarang secara gratis

Visualisasi Data Skor SAT NYC

Pada pelajaran sebelumnya, saat membahas Latin Squares, kita melakukan EDA numerik dengan melihat mean, varians, dan median skor SAT matematika. Bagian penting lain dari EDA adalah visualisasi data, karena sering membantu menemukan outlier dan memberikan representasi visual dari sebaran variabel Anda.

ggplot2 telah dimuat untuk Anda dan himpunan data nyc_scores tersedia. Buat dan telaah boxplot yang diminta. Bagaimana perbedaan median antar Borough? Berapa banyak outlier yang ada, dan di mana paling banyak muncul?

Latihan ini adalah bagian dari kursus

Perancangan Eksperimen di R

Lihat Kursus

Petunjuk latihan

  • Buat boxplot skor SAT Matematika berdasarkan Borough.
  • Jalankan kode untuk menyertakan judul: "Average SAT Math Scores by Borough, NYC".
  • Ubah label sumbu x dan y menjadi "Borough (NYC)" dan "Average SAT Math Scores (2014-15)", masing-masing, menggunakan argumen yang benar pada labs().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a boxplot of Math scores by Borough, with a title and x/y axis labels
ggplot(___) +
  ___ + 
  labs(title = "Average SAT Math Scores by Borough, NYC",
  	   ___,
  	   ___)
Edit dan Jalankan Kode