1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

ćwiczenie

Analiza przeuczenia modelu XGBoost

Po wytrenowaniu 3 modeli XGBoost z różnymi maksymalnymi głębokościami drzewa czas ocenić ich jakość. W tym celu zmierzysz jakość każdego modelu na danych treningowych i testowych. Dane treningowe to te, na których modele były trenowane. Dane testowe to dane sprzedażowe z kolejnego miesiąca – modele nigdy wcześniej ich nie widziały.

Celem tego ćwiczenia jest sprawdzenie, czy któryś z wytrenowanych modeli jest przeuczony. Do oceny jakości modeli użyjesz błędu średniokwadratowego (MSE). Jest on dostępny w bibliotece sklearn.metrics jako funkcja mean_squared_error(), która przyjmuje dwa argumenty: wartości rzeczywiste i wartości przewidywane.

W środowisku roboczym masz dostęp do ramek danych train i test oraz 3 wytrenowanych modeli: xg_depth_2, xg_depth_8 i xg_depth_15.

Instrukcje

100 XP
  • Wykonaj predykcje dla każdego modelu na danych treningowych i testowych.
  • Oblicz MSE między wartościami rzeczywistymi a przewidywanymi dla danych treningowych i testowych.