1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

Prozkoumej přeučení XGBoost modelů

Natrénoval/a sis 3 modely XGBoost s různou maximální hloubkou – teď je čas vyhodnotit jejich kvalitu. Změříš výkon každého modelu na trénovacích i testovacích datech. Trénovací data jsou ta, na kterých se modely učily. Testovací data představují prodeje z následujícího měsíce, která modely dosud nikdy neviděly.

Cílem tohoto cvičení je zjistit, zda některý z natrénovaných modelů trpí přeučením. Ke změření kvality modelů použiješ střední kvadratickou chybu (MSE). Ta je dostupná v sklearn.metrics jako funkce mean_squared_error(), která přijímá dva argumenty: skutečné hodnoty a predikované hodnoty.

V pracovním prostředí máš k dispozici DataFramy train a test spolu se 3 natrénovanými modely (xg_depth_2, xg_depth_8, xg_depth_15).

Pokyny

100 XP
  • Vytvoř predikce každého modelu pro trénovací i testovací data.
  • Vypočítej MSE mezi skutečnými hodnotami a predikcemi pro trénovací i testovací data.