1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

첫 번째 분류 트리 훈련하기

이 연습 문제에서는 UCI Machine Learning 저장소의 위스콘신 유방암 데이터셋을 사용합니다. 종양의 평균 반지름(radius_mean)과 평균 오목점 수(concave points_mean), 두 가지 특성을 기반으로 종양이 악성인지 양성인지를 예측합니다.

데이터셋은 이미 워크스페이스에 로드되어 있으며, 80%는 훈련 세트, 20%는 테스트 세트로 분할되어 있습니다. 특성 행렬은 X_train과 X_test에, 레이블 배열은 y_train과 y_test에 할당되어 있습니다. 클래스 1은 악성 종양, 클래스 0은 양성 종양을 나타냅니다. 재현 가능한 결과를 얻기 위해 SEED 변수를 1로 설정해 두었습니다.

지침

100 XP
  • sklearn.tree에서 DecisionTreeClassifier를 임포트하세요.

  • 최대 깊이가 6인 DecisionTreeClassifier dt를 생성하세요.

  • dt를 훈련 세트에 학습시키세요.

  • 테스트 세트의 레이블을 예측하고 결과를 y_pred에 할당하세요.