Avaliando e comparando algoritmos
Agora que criamos um novo modelo com GBTRegressor, é hora de compará-lo com nossa linha de base, o RandomForestRegressor. Para isso, vamos comparar as previsões de ambos os modelos com os dados reais e calcular RMSE e R^2.
Este exercício faz parte do curso
Feature Engineering com PySpark
Instruções do exercício
- Importe
RegressionEvaluatordepyspark.ml.evaluationpara usá-lo mais adiante. - Inicialize
RegressionEvaluatordefinindolabelColcomo nossos dados reais,SALESCLOSEPRICE, epredictionColcomo nossos dados previstos,Prediction_Price. - Para calcular nossas métricas, chame
evaluateemevaluatorcom os valores de previsãopredse crie um dicionário com a chaveevaluator.metricNamee o valorrmse; faça o mesmo para a métricar2.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from ____ import ____
# Select columns to compute test error
evaluator = ____(____=____,
____=____)
# Dictionary of model predictions to loop over
models = {'Gradient Boosted Trees': gbt_predictions, 'Random Forest Regression': rfr_predictions}
for key, preds in models.items():
# Create evaluation metrics
rmse = evaluator.____(____, {____: ____})
r2 = evaluator.____(____, {____: ____})
# Print Model Metrics
print(key + ' RMSE: ' + str(rmse))
print(key + ' R^2: ' + str(r2))