1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

Bài tập

Huấn luyện mô hình đó

Một đặc tả mô hình là khởi đầu tốt, giống như tấm toan cho họa sĩ. Nhưng cũng như họa sĩ cần màu sắc, đặc tả cần dữ liệu. Chỉ mô hình cuối cùng mới có thể đưa ra dự đoán:

Đặc tả mô hình + dữ liệu = mô hình

Trong bài tập này, bạn sẽ huấn luyện một cây quyết định để mô hình hóa nguy cơ mắc tiểu đường, với các biến sức khỏe làm biến dự đoán. Biến phản hồi outcome cho biết bệnh nhân có bị tiểu đường hay không, nghĩa là đây là bài toán phân loại nhị phân (chỉ có hai lớp). Bộ dữ liệu cũng chứa các biến sức khỏe của bệnh nhân như blood_pressure, age, và bmi.

Trong phần còn lại của khóa học, gói tidymodels sẽ luôn được nạp sẵn. Trong bài tập này, bộ dữ liệu diabetes cũng đã có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Tạo tree_spec, một đặc tả cho cây quyết định với engine rpart.
  • Huấn luyện mô hình tree_model_bmi, trong đó outcome chỉ phụ thuộc vào biến dự đoán bmi bằng cách fit bộ dữ liệu diabetes theo đặc tả.
  • In mô hình ra console.