1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu khảo sát bằng Python

Connected

Bài tập

Khớp mô hình hồi quy tuyến tính

Một khảo sát lương ẩn danh được thực hiện hằng năm từ 2015 dành cho các chuyên gia IT châu Âu. Năm 2018, hàng trăm người đã tình nguyện tham gia. Trong dữ liệu khảo sát có số năm kinh nghiệm của người trả lời và mức lương hiện tại của họ.

Bạn sẽ phân tích mối quan hệ giữa hai biến này để xem liệu nhiều năm kinh nghiệm hơn dẫn đến mức lương cao hơn hay thấp hơn.

Biến độc lập của bạn là experience_years, và biến phụ thuộc là current_salary.

Dữ liệu đã được nạp sẵn dưới tên data, cùng với statsmodels.api và pandas, lần lượt là sm và pd.

Hướng dẫn

100 XP
  • Xác định các biến x và y.
  • Thêm hạng số (constant term).
  • Thực hiện hồi quy OLS() và .fit() mô hình.
  • In bảng tóm tắt (summary).