1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 지도 학습

Connected

연습 문제

R-squared를 위한 교차 검증

교차 검증(cross-validation)은 모델을 평가하는 핵심적인 방법입니다. 모델이 훈련뿐만 아니라 전체 데이터에 대한 테스트도 수행하므로, 사용 가능한 데이터를 최대한 활용할 수 있습니다.

이번 연습 문제에서는 선형 회귀 모델을 구축한 후, 6-겹 교차 검증(6-fold cross-validation)을 사용하여 소셜 미디어 광고 지출을 기반으로 한 판매량 예측 정확도를 평가합니다. 6개 폴드 각각의 개별 점수를 출력해 보세요.

sales_df 데이터셋은 타깃 변수인 y와 피처인 X로 분할되어 미리 로드되어 있습니다. LinearRegression은 sklearn.linear_model에서 이미 임포트되어 있습니다.

지침

100 XP
  • KFold와 cross_val_score를 임포트하세요.
  • kf를 호출하여 KFold()를 생성하되, 분할 수를 6으로, shuffle을 True로, 시드를 5로 설정하세요.
  • reg와 X에 대해 y를 사용하여 교차 검증을 수행하고, kf에 cv를 전달하세요.
  • cv_scores를 출력하세요.