1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

기준으로 엔트로피 사용하기

이번 연습에서는 Wisconsin Breast Cancer 데이터셋에 대해 정보 기준으로 엔트로피를 사용해 분류 트리를 학습해 보겠습니다. 데이터셋의 30개 모든 특성을 사용하며, 데이터는 학습 80%, 테스트 20%로 분할되어 있습니다.

작업 공간에는 X_train과 레이블 배열 y_train이 제공되어 있습니다.

지침

100 XP
  • sklearn.tree에서 DecisionTreeClassifier를 임포트하세요.

  • 최대 깊이가 8인 DecisionTreeClassifier를 dt_entropy라는 이름으로 인스턴스화하세요.

  • 정보 기준을 'entropy'로 설정하세요.

  • 학습 세트에 dt_entropy를 학습(fit)하세요.