랜덤 포레스트 모델 구축하기

이번에도 Pima Indians 데이터셋으로 개인의 당뇨병 여부를 예측해 볼 거예요. 이번에는 랜덤 포레스트 분류기를 사용합니다. 학습-테스트 분할을 수행한 뒤 학습 데이터에 모델을 학습시키고, 특성 중요도 값을 확인하세요.

특성 데이터셋과 타깃 데이터셋은 각각 X, y로 미리 로드되어 있어요. 필요한 패키지와 함수도 모두 준비되어 있습니다.