1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

연습 문제

R-squared에 대한 교차 검증

교차 검증은 모델을 평가하는 데 매우 중요한 방법이에요. 모델이 사용 가능한 모든 데이터로 학습될 뿐 아니라 테스트되기도 하므로, 모델이 활용할 수 있는 데이터 양을 극대화합니다.

이 연습 문제에서는 선형 회귀 모델을 만든 뒤, 소셜 미디어 광고비를 사용해 매출을 예측하는 정확도를 6-폴드 교차 검증으로 평가해 볼 거예요. 여섯 개 폴드 각각의 개별 점수도 출력합니다.

sales_df 데이터셋은 타깃 변수 y와 특징 X로 분할되어 미리 로드되어 있어요. LinearRegression은 sklearn.linear_model에서 이미 임포트되어 있습니다.

지침

100 XP
  • KFold와 cross_val_score를 임포트하세요.
  • 분할 수를 6으로, shuffle을 True로, 시드를 5로 설정하여 KFold()를 호출해 kf를 생성하세요.
  • reg를 사용해 X와 y에 대해 교차 검증을 수행하고, cv에 kf를 전달하세요.
  • cv_scores를 출력하세요.