1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서의 앙상블 기법

Connected

연습 문제

영화 수익 예측하기

'budget' 특성에 기반해 영화의 로그 수익을 추정하는 간단한 선형 회귀부터 시작해 봅시다. 여기서 사용할 평가지표는 RMSE(root mean squared error)입니다. scikit-learn으로 계산하려면 sklearn.metrics 모듈의 mean_squared_error() 함수를 사용한 뒤, numpy로 그 제곱근을 취하면 됩니다.

movies 데이터셋은 이미 불러와 학습/테스트 세트로 분할해 두었습니다. 또한 결측값은 0으로 대체했으며, 입력 특성은 StandardScaler()로 표준화했습니다. Machine Learning을 위한 전처리에 대해 더 배우고 싶다면 DataCamp의 데이터 정제와 특성 공학 강의를 참고하세요.

지침

100 XP
  • 기본 LinearRegression 모델을 인스턴스화하세요.
  • 테스트 세트에 대한 예측값을 계산하세요.
  • RMSE를 계산하세요. mean_squared_error() 함수에는 두 개의 인수가 필요합니다: 먼저 y_test, 그다음 예측값입니다.