1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with PySpark

Connected

cvičení

Zpožděné lety s Gradient-Boosted Trees

V předchozím cvičení jsi sestavil/a klasifikátor pro lety se pravděpodobným zpožděním pomocí rozhodovacího stromu. V tomto cvičení porovnáš model Decision Tree s modelem Gradient-Boosted Trees.

Data o letech byla náhodně rozdělena na flights_train a flights_test.

Pokyny

100 XP
  • Importuj třídy potřebné k vytvoření klasifikátorů Decision Tree a Gradient-Boosted Tree.
  • Vytvoř klasifikátory Decision Tree a Gradient-Boosted Tree a natrénuj je na trénovacích datech.
  • Vytvoř evaluátor a vypočítej AUC na testovacích datech pro oba klasifikátory. Který model podává lepší výsledky?
  • Pro klasifikátor Gradient-Boosted Tree vypiš počet stromů a relativní důležitost příznaků.