1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế thí nghiệm với R

Connected

Bài tập

Mục đích vay ảnh hưởng thế nào đến số tiền được giải ngân?

Trong bài trước, chúng ta đã rút gọn biến purpose xuống còn 4 nhóm hợp lý hơn và gọi là purpose_recode. Với vai trò nhà khoa học dữ liệu tại Lending Club, bạn có thể muốn thiết kế một thí nghiệm để xem mục đích vay ảnh hưởng thế nào đến số tiền được giải ngân (funded_amnt), tức là khoản tiền thực tế cấp cho người nộp đơn.

Hãy nhớ rằng với kiểm định ANOVA, giả thuyết không (null) là tất cả các giá trị trung bình của số tiền giải ngân đều bằng nhau giữa các mức của purpose_recode. Giả thuyết đối là có ít nhất một mức của purpose_recode có trung bình khác biệt. Tuy nhiên, ta sẽ chưa biết chính xác mức nào nếu không thực hiện phân tích hậu nghiệm (post hoc), vì vậy sẽ hữu ích khi biết kết quả ANOVA được lưu trữ như một đối tượng trong R như thế nào.

Hướng dẫn

100 XP
  • Dùng lm() để xem biến purpose_recode ảnh hưởng tới funded_amnt ra sao. Lưu mô hình vào một đối tượng tên purpose_recode_model.
  • Dùng summary() để xem purpose_recode_model. Đây là kết quả của hồi quy tuyến tính.
  • Gọi anova() trên purpose_recode_model. Lưu vào một đối tượng tên purpose_recode_anova. In ra console bằng cách gõ tên đối tượng.
  • Cuối cùng, kiểm tra lớp (class) của purpose_recode_anova.