1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 설계하는 Machine Learning 워크플로

Connected

연습 문제

첫 번째 파이프라인 - 다시 한 번!

부정맥 스타트업으로 돌아와서, 월간 점검이 다가오고 있어요. 그 일환으로 숙련된 Python 프로그래머가 여러분의 코드를 리뷰할 예정이에요. 모범 사례를 따라 코드를 정리하기로 하고, 특성 선택과 랜덤 포레스트 분류를 수행하던 스크립트를 파이프라인으로 대체하려고 해요. 학습용 데이터셋은 X_train과 y_train으로 제공되며, 사용할 모듈은 특성 선택을 위한 RandomForestClassifier, SelectKBest(), f_classif(), 그리고 GridSearchCV, Pipeline이에요.

지침

100 XP
  • 샘플 코드에서 제공된 특성 선택기를 사용하고, 랜덤 포레스트 분류기를 추가해 파이프라인을 만드세요. 첫 번째 단계 이름은 feature_selection으로 하세요.
  • params에 두 개의 키-값 쌍을 추가하세요. 선택기에서 사용할 특성 수 k에 대해 10과 20을, 포레스트의 n_estimators에 대해 가능한 값 2와 5를 지정하세요.
  • 주어진 파이프라인과 파라미터 그리드를 사용해 GridSearchCV 객체를 초기화하세요.
  • 객체를 데이터에 적합(fit)하고, 가장 성능이 좋은 파라미터 조합을 출력하세요.