1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

Bài tập

Aritmetické příznaky

Pro procvičení tvorby nových příznaků budeš pracovat se vzorkem dat z Kaggle soutěže „House Prices: Advanced Regression Techniques". Cílem této soutěže je předpovědět cenu domu na základě jeho vlastností. Jde o regresní úlohu, kde se jako evaluační metrika používá Root Mean Squared Error.

Tvým úkolem je vytvořit nové příznaky a zjistit, jestli zlepší tvoje validační skóre. Pro získání validačního skóre pomocí 5-násobné křížové validace máš k dispozici funkci get_kfold_rmse(). Použij ji s DataFrame train, který je dostupný ve tvém workspace, jako argumentem.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Vytvoř nový příznak reprezentující celkovou plochu domu (suterén, 1. a 2. podlaží). Sloupce "TotalBsmtSF", "FirstFlrSF" a "SecondFlrSF" udávají plochy suterénu, 1. a 2. podlaží.