1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering with PySpark

Connected

cvičení

Vyhodnocení a porovnání algoritmů

Teď, když máme nový model s GBTRegressor, je čas porovnat ho s naším základním modelem RandomForestRegressor. Porovnáme predikce obou modelů se skutečnými daty a vypočítáme RMSE a R^2.

Pokyny

100 XP
  • Importuj RegressionEvaluator z pyspark.ml.evaluation, aby byl dostupný pro další použití.
  • Inicializuj RegressionEvaluator tak, že nastavíš labelCol na naše skutečná data, SALESCLOSEPRICE, a predictionCol na naše predikovaná data, Prediction_Price.
  • Pro výpočet metrik zavolej evaluate na objektu evaluator s hodnotami predikcí preds a vytvoř slovník s klíčem evaluator.metricName a hodnotou rmse, totéž proveď pro metriku r2.