1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Các đặc trưng số học

Để luyện tập tạo đặc trưng mới, bạn sẽ làm việc với một mẫu con từ cuộc thi Kaggle "House Prices: Advanced Regression Techniques". Mục tiêu của cuộc thi là dự đoán giá nhà dựa trên các thuộc tính của nó. Đây là một bài toán hồi quy với chỉ số đánh giá là Root Mean Squared Error.

Mục tiêu của bạn là tạo đặc trưng mới và xác định xem chúng có giúp cải thiện điểm xác thực hay không. Để lấy điểm xác thực từ quy trình cross-validation 5-fold, bạn được cung cấp hàm get_kfold_rmse(). Hãy dùng hàm này với DataFrame train (có sẵn trong workspace của bạn) làm đối số.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Tạo một đặc trưng mới biểu diễn tổng diện tích (tầng hầm, tầng 1 và tầng 2) của ngôi nhà. Các cột "TotalBsmtSF", "FirstFlrSF" và "SecondFlrSF" lần lượt cho biết diện tích tầng hầm, tầng 1 và tầng 2.