1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. 사례 연구: R로 하는 탐색적 데이터 분석

Connected

Bài tập

주제와 국가별로 중첩하기

이전 장에서는 각 국가의 데이터를 국가별로 중첩한 뒤, 각 데이터셋에 선형 모델을 적합하고, broom으로 모델 출력을 정리한 다음 계수를 unnest하여 국가별 선형 모델을 만들었습니다. 코드는 다음과 비슷했어요:

country_coefficients <- by_year_country %>%
  nest(-country) %>%
  mutate(model = map(data, ~ lm(percent_yes ~ year, data = .)),
         tidied = map(model, tidy)) %>%
  unnest(tidied)

이번에는 시간에 따른 "찬성 비율" 변화(percentage yes)를 다시 모델링하지만, 국가마다 하나의 모델을 적합하는 대신 국가와 주제의 조합마다 하나의 모델을 적합할 거예요.

Hướng dẫn

100 XP
  • purrr, tidyr, broom 패키지를 불러오세요.
  • by_country_year_topic 데이터셋을 콘솔에 출력하세요.
  • 이 데이터셋에서 국가와 주제별로 선형 모델을 적합하고, 결과를 country_topic_coefficients로 저장하세요. 제공된 코드를 시작점으로 사용해도 됩니다.
  • country_topic_coefficients 데이터셋을 콘솔에 출력하세요.