1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

첫 번째 분류 트리 학습하기

이 연습 문제에서는 UCI machine learning 저장소의 Wisconsin Breast Cancer Dataset을 사용해 보겠습니다. 종양의 평균 반지름(radius_mean)과 오목한 점의 평균 개수(concave points_mean) 두 가지 특성을 바탕으로 종양이 악성(malignant)인지 양성(benign)인지 예측해 볼 거예요.

데이터셋은 이미 워크스페이스에 로드되어 있으며, 80%는 훈련, 20%는 테스트로 분할되어 있습니다. 특성 행렬은 X_train과 X_test에, 레이블 배열은 y_train과 y_test에 할당되어 있어요. 여기서 클래스 1은 악성 종양, 클래스 0은 양성 종양을 의미합니다. 재현 가능한 결과를 위해 SEED 변수를 1로 설정해 두었습니다.

지침

100 XP
  • sklearn.tree에서 DecisionTreeClassifier를 임포트하세요.

  • 최대 깊이가 6인 DecisionTreeClassifier를 생성해 dt에 할당하세요.

  • dt를 훈련 세트에 적합(fit)하세요.

  • 테스트 세트의 레이블을 예측하고 결과를 y_pred에 저장하세요.