1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. R에서 확장 가능한 데이터 처리

Connected

Bài tập

예측 가능한 결측 찾기

데이터가 완전 무작위로 결측(MCAR)이라면, 나머지 정보로 특정 변수가 결측인지 예측할 수 없어야 해요. 따라서 결측을 예측할 수 있다면, 데이터는 완전 무작위로 결측이 아닌 것이죠. 이제 이전에 만든 mort 변수에서 affordability를 바탕으로 결측 여부를 살펴보기 위해 glm() 함수를 사용해 로지스틱 회귀를 적합해 봅시다. 결측 데이터에서 뚜렷한 구조(즉, 기울기 계수가 유의하지 않음)를 발견하지 못하더라도, 이것이 결측이 무작위임을 증명하는 것은 아니지만 그럴 가능성은 있다고 볼 수 있어요.

Hướng dẫn

100 XP
  • 주택담보대출 데이터에서 "borrower_race"가 결측인지(값이 9인지) 표시하는 변수를 만드세요.
  • "affordability" 열을 범주형 변수로 만드세요.
  • affordability_factor를 borrower_race_ind에 회귀하고, 그 결과에 summary()를 호출하세요.