1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

Exercise

mice 흐름: mice - with - pool

연쇄 방정식에 의한 다중 대치(MICE)는 조건부 분포에서 표본을 추출하면서 모델 기반 대치를 통해 데이터 세트를 여러 번 대치해, 대치에 따른 불확실성을 추정할 수 있게 해줍니다. 이렇게 하면 각 대치 데이터 세트는 조금씩 달라집니다. 이후 각 데이터 세트에 대해 분석을 수행하고, 결과를 합쳐서 관심 있는 추정치와 함께 대치 불확실성을 반영한 신뢰구간을 얻습니다.

이번 연습에서는 전형적인 MICE 흐름인 mice() - with() - pool()을 실습합니다. biopics 데이터에서 어떤 인물 직업인 sub_type이 가장 높은 영화 수익과 관련이 있는지 회귀 분석으로 살펴보세요. 자, mice로 시작해 볼까요!

Instrukcje

100 XP
  • mice 패키지를 로드하고, 5개의 대치로 mice()를 사용해 biopics를 대치한 뒤 결과를 biopics_multiimp에 저장하세요.
  • 각 대치 데이터 세트에 대해 year와 sub_type으로 earnings를 설명하는 선형 회귀 모델을 적합하고, 결과를 lm_multiimp에 저장하세요.
  • lm_multiimp에 저장된 회귀 모델들을 풀링하여 결과를 lm_pooled에 저장하세요.
  • lm_pooled를 요약해 신뢰수준 95%의 신뢰구간이 생성되도록 하세요.