1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

Exercise

Cechy arytmetyczne

Aby poćwiczyć tworzenie nowych cech, będziesz pracować z próbką danych z konkursu Kaggle o nazwie "House Prices: Advanced Regression Techniques". Celem tego konkursu jest przewidywanie ceny domu na podstawie jego właściwości. To zadanie regresji, w którym metryką ewaluacji jest pierwiastek ze średniego błędu kwadratowego (RMSE).

Twoim zadaniem jest tworzenie nowych cech i sprawdzanie, czy poprawiają wynik walidacji. Do obliczenia wyniku walidacji metodą 5-krotnej walidacji krzyżowej masz do dyspozycji funkcję get_kfold_rmse(). Użyj jej z DataFrame train, dostępnym w twoim środowisku pracy, jako argumentem.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Utwórz nową cechę reprezentującą łączną powierzchnię domu (piwnica, pierwsze i drugie piętro). Kolumny "TotalBsmtSF", "FirstFlrSF" i "SecondFlrSF" zawierają odpowiednio powierzchnie piwnicy, pierwszego i drugiego piętra.