1. 学习
  2. /
  3. 课程
  4. /
  5. 엔드 투 엔드 Machine Learning

Connected

练习

특성 선택

모델링을 준비할 때, 예측(또는 진단)의 근거가 될 유용한 특성 집합을 갖추는 것이 중요해요. 유용하려면, 특성이 심장 질환 데이터셋의 핵심 특성을 서로 독립적으로 잘 포착해야 합니다. 데이터가 많다고 항상 더 좋은 것은 아니에요!

sklearn.feature_selection.SelectFromModel 모듈을 사용해 유용한 특성을 선택할 수 있어요. SelectFromModel은 RandomForestClassifier 모델을 사용해 심장 질환 진단 작업에 가장 중요한 특성을 찾아내는 브루트포스 방식을 구현합니다.

RandomForestClassifier는 이미 가져왔고, 심장 질환 데이터의 특성과 타깃은 각각 X_train과 y_train으로 불러와져 있어요.

说明 1 / 共 4 个

undefined XP
    1
    2
    3
    4
  • n_jobs = -1, class_weight는 'balanced', max_depth = 5로 랜덤 포레스트 분류기을(를) 정의하고, .fit()을 사용해 heart_disease_df에 대해 특성 선택을 수행하세요.