1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. R로 배우는 실험 설계

Connected

Bài tập

결측 시험 점수 처리하기

SAT 점수를 결과 변수로 사용하려면, 먼저 결측치를 살펴봐야 합니다. naniar 패키지의 miss_var_summary()를 사용해 nyc_scores의 모든 변수에서 결측 패턴을 확인해 보세요. naniar는 파이프 연산자(%>%)를 포함한 Tidyverse 코드 스타일과 잘 통합됩니다.

각 과목마다 60개의 결측 점수가 있습니다. MICE, Amelia, mi처럼 더 고급 보간(imputation)을 도와주는 R 패키지도 많지만, 여기서는 계속해서 simputation과 impute_median()을 사용하겠습니다.

Borough(자치구)별로 수학 점수를 보간하여 새 데이터셋 nyc_scores_2를 만들어 보세요. 단, impute_median()은 보간된 변수를 "impute" 타입으로 반환한다는 점에 유의하세요. 별도의 단계에서 해당 변수를 numeric으로 변환하게 됩니다.

simputation과 dplyr는 로드되어 있습니다.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • naniar 패키지를 로드하세요.
  • nyc_scores를 miss_var_summary()로 파이프하여 변수들의 결측 정도를 확인하세요.