1. 학습
  2. /
  3. 강의
  4. /
  5. Tidyverse로 배우는 범주형 데이터

Connected

연습 문제

데이터 요약하기

이제 학습 플랫폼별 유용성을 비교하기 위해 패싯 그래프를 그려 보겠습니다.

이번 연습에서는 새로운 dplyr 함수 add_count()를 소개합니다. add_count()는 원래 데이터셋과 같은 행 수를 유지하면서 열 n을 데이터셋에 추가합니다. count()와 마찬가지로 기본적으로 n은 각 그룹의 행 개수이지만, wt(가중치) 인수를 사용해 바꿀 수 있습니다. wt에 다른 열을 지정하면, 각 그룹에 대해 그 열의 합을 n으로 만들 수 있습니다.

예를 들어 iris에 같은 Species에 속한 꽃들의 Petal.Length 합계를 나타내는 열을 추가하려면 다음과 같이 작성합니다:

iris %>%
   add_count(Species, wt = Petal.Length) %>%
   select(Species, Petal.Length, n)

그러면 다음과 같은 결과가 나옵니다:

# A tibble: 150 x 3
   Species Petal.Length     n
   <fct>          <dbl> <dbl>
 1 setosa           1.4  73.1
 2 setosa           1.4  73.1
 3 virginica        6.4  278.

지침 1/4

undefined XP
    1
    2
    3
    4
  • count()를 사용해 데이터셋을 learning_platform과 usefulness의 각 조합당 한 행으로 바꾸고, 해당 조합의 개수를 담은 열을 추가하세요.