1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 신용 위험 모델링

Connected

연습 문제

결측값 유지하기

어떤 상황에서는 입력값이 비어 있다는 사실 자체가 중요한 정보가 되기도 해요. 조잡 분류(coarse classification)를 사용하면 NA를 별도의 "missing" 범주로 둘 수 있어요.

조잡 분류는 데이터를 단순화하고 모델의 해석 가능성을 높이는 데 도움이 됩니다. 조잡 분류는 값을 범위별로 묶어 그룹화(빈닝)하는 과정을 요구합니다. 이 빈닝 기법을 사용해 모든 NA를 자체 빈으로 배치할 수 있어요.

영상에서는 재직 기간(employment length)에 대해 조잡 분류 아이디어를 설명했어요. 그 예시의 코드는 오른쪽 R 스크립트에 다시 제공되어 있으며, 이를 응용해 int_rate 변수를 조잡 분류하도록 수정할 수 있습니다.

지침

100 XP
  • 제공된 코드를 수정해 int_rate를 조잡 분류하고, 결과를 ir_cat이라는 새 변수에 저장하세요.
    • 먼저, R 스크립트에서 나타나는 loan_data$emp_cat을 loan_data$ir_cat으로, loan_data$emp_length를 loan_data$int_rate로 각각 바꾸세요.
    • 다음으로, 범주를 "0-8", "8-11", "11-13.5", "13.5+"로 빈닝하세요(기존의 "0-15","15-30","30-45", "45+"를 대체). >와 <=의 사용 방식은 영상과 동일합니다. 조건문 안의 숫자도 반드시 바꾸세요(15, 30, 45를 각각 8, 11, 13.5로 변경).
  • plot(loan_data$ir_cat)을 사용해 새 변수 ir_cat을 확인하세요.