1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 하는 Machine Learning

Connected

연습 문제

항공편 소요 시간 모델: 거리만 사용

이번 연습에서는 회귀 모델을 만들어 항공편 소요 시간(duration 열)을 예측해 보겠습니다.

우선은 모델을 단순하게 유지하여, 예측 변수로 항공편 거리(km 열)만 포함하겠습니다.

데이터는 flights에 있습니다. 처음 몇 개의 레코드는 터미널에 표시되어 있습니다. 이 데이터는 이미 학습용과 테스트용으로 분할되어 있으며, flights_train과 flights_test로 사용할 수 있습니다.

지침

100 XP
  • 선형 회귀 객체를 생성하세요. 레이블 열 이름을 지정하고, 학습 데이터에 적합하세요.
  • 테스트 데이터에 대해 예측을 수행하세요.
  • 회귀 평가자 객체를 생성하고, 이를 사용해 테스트 데이터의 RMSE를 평가하세요.