1. Learn
  2. /
  3. Courses
  4. /
  5. Mô hình hóa rủi ro tín dụng bằng R

Connected

Exercise

Nhiều biến trong một mô hình hồi quy logistic

Cách diễn giải một tham số đơn lẻ vẫn giữ nguyên khi bạn đưa nhiều biến vào mô hình. Khi bạn bao gồm nhiều biến và yêu cầu diễn giải khi một biến nào đó thay đổi, ta giả định rằng các biến còn lại giữ nguyên, không đổi. Có một cụm từ Latin hoa mỹ cho điều này, ceteris paribus, nghĩa đen là "giữ tất cả các yếu tố khác như cũ".

Để xây dựng mô hình hồi quy logistic với nhiều biến, bạn có thể dùng dấu + để thêm biến. Công thức sẽ có dạng:

y ~ x1 + ... + xk

Khi đánh giá mô hình, có một số điểm bạn cần lưu ý. Bạn đã xem các giá trị tham số, nhưng đó không phải là yếu tố duy nhất quan trọng. Mức ý nghĩa thống kê của ước lượng một tham số cũng rất quan trọng. Mức ý nghĩa của một tham số thường được gọi là p-value, tuy nhiên trong đầu ra của mô hình bạn sẽ thấy được ký hiệu là Pr(>|t|). Trong glm, mức ý nghĩa nhẹ được ký hiệu bằng dấu "." và mức ý nghĩa rất mạnh bằng "***". Khi một tham số không có ý nghĩa thống kê, điều đó có nghĩa là bạn không thể khẳng định tham số đó khác 0 một cách có ý nghĩa. Ý nghĩa thống kê rất quan trọng. Nói chung, chỉ nên diễn giải tác động lên khả năng vỡ nợ đối với các tham số có ý nghĩa thống kê.

Instructions

100 XP
  • Tạo mô hình hồi quy logistic bằng hàm glm() và training_set. Bao gồm các biến age, ir_cat, grade, loan_amnt và annual_inc. Đặt tên mô hình này là log_model_multi.
  • Lấy mức ý nghĩa bằng cách dùng summary() kết hợp với mô hình của bạn. Bạn sẽ tìm hiểu sâu hơn ý nghĩa của các mức này trong Bài tập tiếp theo!