1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 트리 기반 Machine Learning

Connected

연습 문제

High bias인가, high variance인가?

이 연습 문제에서는 이전 연습에서 학습한 회귀 트리 dt가 bias 문제인지 variance 문제인지 진단해 보겠습니다.

학습 세트 RMSE(RMSE_train)와 교차 검증 RMSE(RMSE_CV)는 작업 공간에 준비되어 있습니다. 추가로, baseline_RMSE 변수도 로드해 두었는데, 이는 disp 특성만 사용해 학습한 회귀 트리가 달성한 제곱근 평균제곱오차(RMSE)에 해당합니다(1장 3과에서 학습한 회귀 트리의 RMSE). 여기서 baseline_RMSE는 기준 RMSE로, 이 값보다 크면 모델이 과소적합(underfitting)으로 간주되고, 이 값보다 작으면 모델이 ‘충분히 좋다’고 간주합니다.

dt는 high bias 문제인가요, 아니면 high variance 문제인가요?

지침

50 XP

가능한 답변