1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

Stacking modelů I

Teď přichází na řadu stacking. K jeho implementaci použiješ 6 kroků, které jsme probrali v předchozím videu:

  1. Rozděl trénovací data na dvě části
  2. Natrénuj více modelů na části 1
  3. Proveď predikce na části 2
  4. Proveď predikce na testovacích datech
  5. Natrénuj nový model na části 2 s využitím predikcí jako příznaků
  6. Proveď predikce na testovacích datech pomocí modelu 2. úrovně

DataFramy train a test jsou už dostupné v tvém pracovním prostředí. features je seznam sloupců, které se použijí pro trénování na datech části 1, a je také dostupný v tvém pracovním prostředí. Název cílové proměnné je "fare_amount".

Pokyny 1/2

undefined XP
    1
    2
  • Rozděl DataFrame train na dvě stejně velké části: part_1 a part_2. Použij funkci train_test_split() s hodnotou test_size rovnou 0.5.
  • Natrénuj modely Gradient Boosting a Random Forest na datech part_1.