1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế thí nghiệm với R

Connected

Bài tập

Khám phá dữ liệu (EDA) điểm SAT của NYC

Toán là môn học mà Hoa Kỳ thường xuyên tụt hậu so với phần còn lại của thế giới, vì vậy các thí nghiệm của chúng ta sẽ tập trung vào điểm Toán. Dù bộ dữ liệu gốc là dữ liệu mở tải từ Kaggle, trong suốt chương này, tôi sẽ bổ sung một vài biến để bạn có thể giả định vai trò nhà nghiên cứu giáo dục đang thiết kế thí nghiệm nhằm nâng điểm của học sinh, qua đó tăng cơ hội vào đại học.

Trước khi đi sâu phân tích thí nghiệm, chúng ta nên làm một chút EDA để đảm bảo hiểu rõ dữ liệu nyc_scores. Trong bài học này, chúng ta sẽ tiến hành thí nghiệm với khối theo Borough và Teacher_Education_Level, nên hãy xem xét điểm Toán theo các biến này. Bộ dữ liệu nyc_scores đã được nạp sẵn cho bạn.

Hướng dẫn 1/3

undefined XP
  • 1
    • Tìm mean, variance, và median của Average_Score_SAT_Math theo Borough bằng các phương thức EDA của dplyr như đã dùng trong khóa học.
  • 2
    • Tìm mean, variance, và median của Average_Score_SAT_Math theo Teacher_Education_Level bằng các phương thức EDA của dplyr.
  • 3
    • Tìm mean, variance, và median của Average_Score_SAT_Math theo cả Borough và Teacher_Education_Level bằng các phương thức EDA của dplyr.