1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech z PySpark

Connected

ćwiczenie

Ocena i porównywanie algorytmów

Mamy już nowy model zbudowany przy użyciu GBTRegressor – czas porównać go z modelem bazowym RandomForestRegressor. W tym celu zestawimy prognozy obu modeli z rzeczywistymi danymi i obliczymy RMSE oraz R^2.

Instrukcje

100 XP
  • Zaimportuj RegressionEvaluator z pyspark.ml.evaluation, aby móc go używać w dalszej części.
  • Zainicjuj RegressionEvaluator, ustawiając labelCol na kolumnę z rzeczywistymi danymi SALESCLOSEPRICE, a predictionCol na kolumnę z prognozami Prediction_Price.
  • Aby obliczyć metryki, wywołaj evaluate na obiekcie evaluator, przekazując wartości prognoz preds, i utwórz słownik z kluczem evaluator.metricName oraz wartością rmse. Zrób to samo dla metryki r2.