1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

Bài tập

Tạo dự đoán

Tạo dự đoán từ dữ liệu là một trong những mục tiêu cốt lõi của Machine Learning. Giờ bạn đã biết cách chia dữ liệu và huấn luyện mô hình, đã đến lúc dùng mô hình để dự đoán cho các mẫu chưa từng thấy.

Bạn sẽ tạo dự đoán cho bộ kiểm tra bằng một mô hình thu được khi fit dữ liệu huấn luyện theo đặc tả cây.

Trong workspace của bạn có sẵn các tập dữ liệu đã tạo trước đó (diabetes_train và diabetes_test) và một đặc tả cây quyết định tree_spec, được tạo bằng đoạn mã sau:

tree_spec <- decision_tree() %>%
  set_engine("rpart") %>%
  set_mode("classification") 

Hướng dẫn

100 XP
  • Fit đặc tả của bạn vào dữ liệu huấn luyện với outcome là biến mục tiêu và tất cả biến dự báo để tạo model.
  • Dùng mô hình để dự đoán khả năng mắc tiểu đường cho mọi quan sát trong bộ kiểm tra và gán kết quả vào predictions.
  • Thêm nhãn thật của bộ kiểm tra vào predictions dưới dạng một cột tên true_class và lưu kết quả thành predictions_combined.
  • Dùng hàm head() để in ra những hàng đầu tiên của kết quả.