1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

Bài tập

Từ số 0 đến người hùng

Bạn đã thành thạo việc tạo đặc tả (specification) cho mô hình và chia dữ liệu thành tập huấn luyện và tập kiểm tra. Bạn cũng biết cách tránh mất cân bằng lớp khi chia dữ liệu. Giờ là lúc kết hợp những gì bạn vừa học và xây dựng mô hình chỉ với tập huấn luyện!

Bạn sẽ tạo một machine learning pipeline hoàn chỉnh. Quy trình này gồm: tạo đặc tả mô hình, chia dữ liệu thành tập huấn luyện và tập kiểm tra, và cuối cùng nhưng không kém phần quan trọng, fit mô hình trên dữ liệu huấn luyện. Chúc bạn học tốt!

Hướng dẫn

100 XP
  • Tạo diabetes_split, một split trong đó tập huấn luyện chứa ba phần tư số dòng của diabetes và cả tập huấn luyện lẫn tập kiểm tra đều có phân phối tương tự nhau ở biến outcome.
  • Xây dựng đặc tả cây quyết định cho mô hình của bạn dùng engine rpart và lưu là tree_spec.
  • Fit mô hình model_trained bằng dữ liệu huấn luyện của diabetes_split với outcome là biến mục tiêu và bmi, skin_thickness là các biến dự báo.