1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark로 하는 Machine Learning

Connected

演習

항공편 선형 회귀 최적화

지금까지는 모델을 만들 때 기본 하이퍼파라미터를 사용했어요. 이번 연습에서는 교차 검증을 활용해 최적(또는 최적에 가까운) 하이퍼파라미터 조합을 선택해 보겠습니다.

다음 객체가 이미 생성되어 있습니다:

  • regression — LinearRegression 객체
  • pipeline — string indexer, one-hot encoder, vector assembler, linear regression으로 구성된 파이프라인
  • evaluator — RegressionEvaluator 객체.

指示

100 XP
  • 파라미터 그리드 빌더를 생성하세요.
  • regression.regParam(값: 0.01, 0.1, 1.0, 10.0)과 regression.elasticNetParam(값: 0.0, 0.5, 1.0)에 대한 그리드를 추가하세요.
  • 그리드를 빌드하세요.
  • 폴드를 다섯 개로 지정해 교차 검증기를 생성하세요.