1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

연습 문제

여러 변수 유형에 대한 모델 기반 대치

조건부 분포에서 표본을 뽑아 로지스틱 회귀 대치를 구현하는 함수를 아주 잘 작성하셨어요. 꽤 고급 통계 기법을 코드로 구현하신 거예요! 이번 연습 문제에서는 지금까지 배운 모델 기반 대치 방법을 결합해 tao 데이터의 서로 다른 유형 변수를 대치해 보겠습니다.

이전 장에서처럼 변수를 순회(iterate)하면서 다음 두 변수를 대치해 주세요:

  • is_hot: air_temp에서 파생한 새로운 이진 변수로, air_temp가 26도 이상이면 1, 그렇지 않으면 0이에요.
  • humidity: 이미 익숙한 연속형 변수예요.

이전에 배운 선형 회귀 함수를 사용하고, 직접 만든 로지스틱 회귀 함수도 함께 활용하셔야 합니다. 시작해 볼까요?

지침

100 XP
  • 원래 결측이었던 위치에서는 is_hot을 NA로 설정하세요.
  • is_hot을 로지스틱 회귀로 대치하세요. 예측 변수는 sea_surface_temp 하나만 사용하고, 여러분의 함수 impute_logreg()을 사용하세요.
  • 원래 결측이었던 위치에서는 humidity를 NA로 설정하세요.
  • humidity를 선형 회귀로 대치하세요. 예측 변수는 sea_surface_temp와 air_temp를 사용하세요.