1. 학습
  2. /
  3. 강의
  4. /
  5. XGBoost로 익히는 Extreme Gradient Boosting

Connected

연습 문제

신장 질환 사례 연구 III: 전체 파이프라인

이제 모든 변환과 XGBClassifier를 함께 묶어 전체 파이프라인을 만들어 볼 차례예요!

이전 연습 문제에서 만든 numeric_categorical_union 외에도, 우리가 미리 만들어 둔 Dictifier() 변환과 DictVectorizer() 두 가지가 더 필요합니다.

파이프라인을 만든 뒤, 교차 검증을 수행해 성능을 확인해 보세요.

지침

100 XP
  • numeric_categorical_union, Dictifier(), DictVectorizer(sort=False) 변환과 max_depth=3인 xgb.XGBClassifier() 추정기를 사용해 파이프라인을 만드세요. 변환의 이름은 각각 "featureunion", "dictifier", "vectorizer", 추정기는 "clf"로 지정합니다.
  • cross_val_score()를 사용해 pipeline에 대해 3-폴드 교차 검증을 수행하세요. 파이프라인 pipeline, 특징 kidney_data, 정답 레이블 y를 전달하고, scoring은 "roc_auc", cv는 3으로 설정하세요.