1. Învăţa
  2. /
  3. Courses
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

exercise

모자이크 플롯

이전 연습 문제에서 만든 스파인 플롯은 한 번에 두 변수 사이의 결측치 패턴을 살펴볼 수 있게 해줍니다. 이 아이디어를 더 많은 변수로 일반화한 것이 모자이크 플롯입니다.

이번 연습에서는 먼저 각 영화 제작에 미국이 관여했는지를 나타내는 더미 변수를 만들 거예요. 이를 위해 첫 번째 인수로 전달한 문자열이 두 번째 인수로 전달한 객체에 포함되어 있는지 확인하는 grepl() 함수를 사용합니다. 그런 다음 모자이크 플롯을 그려서, 미국 영화와 비(非)미국 영화 모두에서 피사체의 성별(sub_sex)이 수익(earnings) 변수의 결측치 양과 상관이 있는지 확인해 보겠습니다.

biopics 데이터와 VIM 패키지는 이미 불러와 두었습니다. 탐색적 플로팅을 시작해 볼까요?

참고: 최신VIM패키지 버전의 출력을 반환하도록 사내display_image()함수가 만들어져 있습니다. 반드시HTML Viewer 섹션을 펼쳐서 확인하세요.

Instrucţiuni

100 XP
  • biopics 데이터를 dplyr 파이프라인에 전달하세요.
  • country에 문자열 "US"가 포함되면 TRUE, 그렇지 않으면 FALSE가 되는 더미 변수 is_US_movie를 만드세요.
  • 변수 이름은 문자열로 전달한다는 점을 기억하면서, "earnings"의 결측치 양을 "is_US_movie"와 "sub_sex"로 나눠 보여주는 모자이크 플롯을 그리세요.