1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa với tidymodels trong R

Connected

Bài tập

Phân bố giá trị của biến kết quả

Phân tầng theo biến kết quả khi tạo tập huấn luyện và tập kiểm tra giúp các giá trị của biến kết quả có phạm vi tương tự ở cả hai tập.

Vì dữ liệu gốc được chia ngẫu nhiên, phân tầng sẽ tránh tình huống, chẳng hạn, tất cả nhà đắt tiền trong home_sales đều rơi vào tập kiểm tra. Khi đó, mô hình của bạn nhiều khả năng hoạt động kém vì được huấn luyện trên các căn nhà ít đắt hơn.

Trong bài tập này, bạn sẽ tính các thống kê tóm tắt cho biến selling_price trong cả tập huấn luyện và tập kiểm tra. Các tibble home_training và home_test đã được nạp sẵn từ bài trước.

Hướng dẫn 1/2

undefined XP
  • 1
    • Tính giá trị nhỏ nhất, lớn nhất, trung bình và độ lệch chuẩn của biến selling_price trong home_training.
  • 2
    • Tính giá trị nhỏ nhất, lớn nhất, trung bình và độ lệch chuẩn của biến selling_price trong home_test.