1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

연습 문제

부트스트랩 집계(Bagging)

이전 레슨에서는 특성 공학을 적용한 데이터에 로지스틱 회귀를 사용해 분류 모델을 간단히 살펴봤어요. Machine Learning 면접에서는 약한 학습기를 결합해 성능을 높이는 강한 학습기를 만드는 앙상블 모델을 알아두면 도움이 되는 경우가 많습니다.

이번 연습에서는 대체 추출(sampling with replacement)을 사용해 무작위성을 유지하고 과적합을 줄이는 bagging 분류기를 적용해 보겠습니다. 비디오 연습에서 본 sklearn.ensemble 모듈의 함수를 사용할 거예요.

필요한 패키지는 모두 임포트되어 있습니다: pandas는 pd, sklearn.model_selection의 train_test_split, sklearn.metrics의 accuracy_score, sklearn.linear_model의 LogisticRegression, 그리고 sklearn.ensemble의 BaggingClassifier와 AdaBoostClassifier.

loan_data DataFrame은 이미 X_train, X_test, y_train, y_test로 분할되어 있어요.

지침 1/4

undefined XP
    1
    2
    3
    4
  • 비디오 연습에서 소개한 적절한 함수를 호출해 bagging 분류기를 인스턴스화하고, 추정기 수를 50으로 설정하세요.