1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

Model stacking II

Tady je přehled toho, co jsi dosud v rámci implementace stackingu udělal/a:

  1. Rozdělil/a jsi trénovací data na dvě části
  2. Natrénoval/a jsi několik modelů na části 1
  3. Udělal/a jsi predikce na části 2
  4. Udělal/a jsi predikce na testovacích datech

Tvým cílem je teď vytvořit model druhé úrovně, který jako vstupní příznaky použije predikce z kroků 3 a 4. Tento model se natrénuje na datech z části 2 a pak pomocí něj můžeš provést finální stackingové predikce na testovacích datech.

DataFramy part_2 a test máš už k dispozici v pracovním prostředí. Predikce z modelů Gradient Boosting a Random Forest jsou v těchto DataFramech uloženy pod názvy "gb_pred" a "rf_pred".

Pokyny

100 XP
  • Natrénuj model Linear Regression na datech z části 2, přičemž jako příznaky použij predikce modelů Gradient Boosting a Random Forest.
  • Pomocí predikcí modelů Gradient Boosting a Random Forest jako příznaků proveď predikce na testovacích datech.