1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 하는 Feature Engineering

Connected

연습 문제

알고리즘 평가 및 비교

GBTRegressor로 새 모델을 만들었으니, 이제 기준선인 RandomForestRegressor와 비교해 보겠습니다. 두 모델의 예측값을 실제 데이터와 비교하고 RMSE와 R^2를 계산할 거예요.

지침

100 XP
  • 나중에 사용할 수 있도록 pyspark.ml.evaluation에서 RegressionEvaluator를 임포트하세요.
  • RegressionEvaluator를 초기화할 때 실제 데이터인 SALESCLOSEPRICE를 labelCol로, 예측 데이터인 Prediction_Price를 predictionCol로 설정하세요.
  • 지표를 계산하려면, 예측값 preds로 evaluator의 evaluate를 호출하고, 키를 evaluator.metricName, 값을 rmse로 하는 딕셔너리를 만들어 전달하세요. r2 지표도 같은 방식으로 계산하세요.