1. 학습
  2. /
  3. 강의
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

연습 문제

사용자 정의 trainControl로 glmnet 적합하기

이제 사용자 정의 trainControl 객체가 준비되었으니, "don't overfit" 데이터셋에 glmnet 모델을 적합해 보세요. 영상에서 보셨듯이, glmnet은 일반화 선형 회귀 모델(glm)을 확장한 것으로, 과적합을 막기 위해 계수의 크기에 제약을 둡니다. 이는 흔히 "페널티를 준" 회귀 모형이라고 하며, 예측 변수가 많고 관측값이 적은 데이터셋에서 특히 유용한 기법입니다.

glmnet은 alpha 매개변수로 제어되는 두 가지 유형의 페널티 회귀를 적합할 수 있습니다:

  • Ridge 회귀(alpha = 0)
  • Lasso 회귀(alpha = 1)

이제 caret 패키지에서 제공하는 기본값을 사용해 "don't overfit" 데이터셋에 glmnet 모델을 적합하겠습니다.

지침

100 XP
  • overfit 데이터에 glmnet 모델을 학습해 model이라는 이름으로 저장하세요. 이전 연습 문제에서 만든 사용자 정의 trainControl(myControl)을 사용합니다. 반응 변수는 y이고, 나머지 모든 변수는 설명 변수입니다.
  • 모델을 콘솔에 출력하세요.
  • max() 함수를 사용해 model[["results"]] 어딘가에 포함된 ROC 통계량의 최댓값을 찾으세요.