1. Learn
  2. /
  3. Курси
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

вправа

Stacking modeli I

Czas na stacking. Aby wdrożyć to podejście, wykonaj 6 kroków omówionych w poprzednim filmie:

  1. Podziel dane treningowe na dwie części
  2. Wytrenuj kilka modeli na Części 1
  3. Wykonaj predykcje na Części 2
  4. Wykonaj predykcje na danych testowych
  5. Wytrenuj nowy model na Części 2, używając predykcji jako cech
  6. Wykonaj predykcje na danych testowych przy użyciu modelu 2. poziomu

DataFrame'y train i test są już dostępne w twoim środowisku. features to lista kolumn używanych do trenowania na danych z Części 1 – również dostępna w środowisku. Nazwa zmiennej docelowej to „fare_amount".

Інструкції 1/2

undefined XP
    1
    2
  • Podziel DataFrame train na dwie równe części: part_1 i part_2. Użyj funkcji train_test_split() z argumentem test_size równym 0.5.
  • Wytrenuj modele Gradient Boosting i Random Forest na danych z part_1.