1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서의 앙상블 기법

Connected

연습 문제

스태킹으로 앱 평점 예측하기

이번 연습 문제에서는 첫 번째 Stacking 앙상블을 만들어 볼 거예요. 사용할 데이터셋은 1장에서 사용했던 것과 같아요. 기억하신다면, 목표는 각 앱의 평점(1~5)을 예측하는 것이었죠. 사용할 입력 특징은 Reviews, Size, Installs, Type, Price, Content Rating입니다.

우리는 이미 1단계: 데이터셋 준비를 마쳤어요. apps라는 이름으로 제공되며, 필요한 특징을 정리했고 결측값은 0으로 대체했어요.

이제 2단계: 1층 추정기(first-layer estimators) 구성을 진행해 볼게요.

지침

100 XP
  • 다음 설정으로 의사결정나무 분류기를 학습하세요: min_samples_leaf: 3, min_samples_split: 9.
  • 다음 설정으로 5-최근접 이웃 분류기를 학습하세요: algorithm: 'ball_tree'(처리를 빠르게 하기 위함).
  • 테스트 세트에 대한 정확도(accuracy) 점수로 각 추정기의 성능을 평가하세요.