1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế thí nghiệm với R

Connected

Bài tập

Khám phá dữ liệu (EDA) theo factorial cho điểm SAT NYC

Hãy làm thêm một chút EDA trước khi đi vào phân tích thí nghiệm factorial của chúng ta.

Hãy kiểm tra ảnh hưởng của Percent_Black_HL, Percent_Tested_HL, và Tutoring_Program lên biến kết quả Average_Score_SAT_Math. HL là viết tắt của high-low, trong đó 1 lần lượt chỉ ra rằng dưới 50% học sinh da đen hoặc dưới 50% tổng số học sinh trong toàn trường đã được kiểm tra, và 2 chỉ ra rằng trên 50% của mỗi nhóm đã được kiểm tra.

Vẽ biểu đồ boxplot cho từng yếu tố so với biến kết quả để hình dung yếu tố nào có sự khác biệt về median theo mức của yếu tố (cuối cùng, bài kiểm định sẽ xem xét khác biệt về mean). Bộ dữ liệu nyc_scores đã được nạp sẵn cho bạn.

Hướng dẫn 1/3

undefined XP
  • 1
    • Tải ggplot2. Tạo một boxplot của biến kết quả theo Tutoring_Program.
  • 2
    • Dùng ggplot2, tạo một boxplot của biến kết quả theo Percent_Black_HL.
  • 3
    • Dùng ggplot2, tạo một boxplot của biến kết quả theo Percent_Tested_HL.