1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Phân tích bản tóm tắt của mô hình tuyến tính

Phân tích hiệu năng của các mô hình đã nội suy khác nhau là một trong những nhiệm vụ quan trọng nhất khi xử lý dữ liệu khuyết. Việc này quyết định loại DataFrame đã nội suy mà bạn có thể tin cậy. Để phân tích, bạn có thể khớp một mô hình hồi quy tuyến tính trên DataFrame đã nội suy và kiểm tra các tham số khác nhau ảnh hưởng đến việc chọn loại nội suy.

Trong bài tập này, bạn đã có sẵn DataFrame diabetes_cc, là bộ dữ liệu hoàn chỉnh (complete case) của DataFrame về bệnh tiểu đường. Bộ dữ liệu hoàn chỉnh đóng vai trò làm chuẩn để so sánh với các DataFrame đã nội suy khác. Bạn sẽ dùng gói statsmodels.api được nạp là sm để tạo mô hình hồi quy tuyến tính và sinh báo cáo tóm tắt.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Đặt tất cả đặc trưng trong DataFrame diabetes_cc làm X bằng cách thêm hằng số, đồng thời loại trừ và đặt cột 'Class' làm y.