1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with PySpark

Connected

cvičení

Vyhodnocení Random Forest

V tomto závěrečném cvičení vyhodnotíš výsledky křížové validace na modelu Random Forest.

Následující objekty už jsou připravené:

  • cv – křížový validátor, který již byl natrénován na trénovacích datech
  • evaluator – objekt BinaryClassificationEvaluator
  • flights_test – testovací data.

Pokyny

100 XP
  • Vypiš seznam průměrných hodnot AUC pro všechny modely v mřížce parametrů.
  • Zobraz průměrné AUC nejlepšího modelu. Bude to nejvyšší hodnota AUC v seznamu.
  • Vypiš vysvětlení parametrů maxDepth a featureSubsetStrategy pro nejlepší model.
  • Zobraz hodnotu AUC pro předpovědi nejlepšího modelu na testovacích datech.