1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 하는 Machine Learning

Connected

연습 문제

Random Forest 평가

이 마지막 연습 문제에서는 Random Forest 모델에 대한 교차 검증 결과를 평가해 보겠습니다.

다음 객체들은 이미 생성되어 있습니다.

  • cv - 훈련 데이터에 이미 fit된 교차 검증기
  • evaluator — BinaryClassificationEvaluator 객체
  • flights_test — 테스트 데이터

지침

100 XP
  • 파라미터 그리드의 모든 모델에 대한 평균 AUC 지표 목록을 출력하세요.
  • 최적 모델의 평균 AUC를 표시하세요. 이 값은 목록에서 가장 큰 AUC입니다.
  • 최적 모델의 maxDepth와 featureSubsetStrategy 파라미터에 대한 설명을 출력하세요.
  • 테스트 데이터에 대한 최적 모델 예측의 AUC를 표시하세요.