1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê với R

Connected

Bài tập

Phương pháp tập xác thực (validation set)

Trong chương về hồi quy tuyến tính, bạn đã khớp một mô hình hồi quy tuyến tính giải thích cân nặng tim (heart weight) của mèo dựa trên cân nặng cơ thể. Người phỏng vấn yêu cầu bạn đánh giá mức độ tốt của mô hình.

Để trả lời, bạn cần tạo dự đoán để so sánh với giá trị thực tế. Với phương pháp tập xác thực (validation set), bạn chia dữ liệu thành hai phần.

Để làm vậy, trước tiên bạn có thể lấy một mẫu gồm, chẳng hạn, 80% số thứ tự dòng. Dùng các số thứ tự dòng này để tạo tập huấn luyện. Phần còn lại của data frame dùng cho kiểm tra.

Hãy nhớ rằng:

rows <- c(1, 3)
df[-rows, ]

chọn tất cả ngoại trừ dòng thứ nhất và thứ ba.

Bộ dữ liệu cats đã có sẵn trong môi trường của bạn.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Chọn ngẫu nhiên 80% (làm tròn) số thứ tự dòng của bộ dữ liệu cats.