모든 것을 하나로 묶기

부정맥 탐지 스타트업의 파이프라인에 대해 두 가지 우려가 있어요:

앱은 모든 연령대의 환자 데이터를 학습했지만, 실제 사용자는 주로 젊은 피트니스 이용자예요. 도메인 시프트가 의심되어 50세 초과 예시는 제외하려고 해요.
과적합도 여전히 걱정되어, 랜덤 포레스트 분류기의 복잡도를 낮추고 일부 특성을 선택하면 도움이 되는지 확인하고자 해요.

SelectKBest() 특성 선택 단계와 RandomForestClassifier로 구성된 파이프라인을 만들 거예요. 둘 다 이미 임포트되어 있어요. 또한 GridSearchCV(), Pipeline, numpy는 np로, pickle에도 접근할 수 있어요. 데이터는 arrh로 제공돼요.

단계 이름 ft로 SelectKBest()를, 단계 이름 clf로 RandomForestClassifier()를 넣어 파이프라인을 만드세요.
SelectKBest()의 k와 RandomForestClassifier()의 max_depth를 튜닝할 파라미터 그리드를 만드세요.
50세 미만만 포함한 데이터에 대해 GridSearchCV()로 해당 그리드에 맞춰 파이프라인을 최적화하세요.
최적화된 파이프라인을 프로덕션 배포를 위해 피클로 저장하세요.

Bài tập

모든 것을 하나로 묶기

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập