1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning trong tidyverse

Connected

Bài tập

Xây dựng & đánh giá mô hình tốt nhất

Bằng cross-validation, bạn đã xác định được mô hình tốt nhất để dự đoán life_expectancy từ tất cả các đặc trưng trong gapminder. Giờ khi đã chọn được mô hình, bạn có thể dùng tập dữ liệu độc lập (testing_data) mà bạn đã giữ lại để ước lượng hiệu năng của mô hình này trên dữ liệu mới.

Bạn sẽ xây dựng mô hình này bằng toàn bộ training_data và đánh giá bằng testing_data.

Hướng dẫn

100 XP
  • Dùng ranger() để xây dựng mô hình hiệu năng tốt nhất (mtry = 4) trên toàn bộ dữ liệu huấn luyện. Gán vào best_model.
  • Trích cột life_expectancy từ testing_data và gán vào test_actual.
  • Dự đoán life_expectancy bằng best_model trên dữ liệu testing và gán vào test_predicted.
  • Tính MAE từ hai vector test_actual và test_predicted.