1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Manipulowanie danymi z dplyr

Connected

Exercise

Łączenie summarize, slice_max i count

W tym rozdziale poznałeś/poznałaś sześć funkcji pakietu dplyr związanych z agregowaniem danych: count(), group_by(), summarize(), ungroup(), slice_max() i slice_min(). W tym ćwiczeniu połączysz je, aby odpowiedzieć na pytanie:

W ilu stanach więcej osób mieszka na obszarach miejskich niż pozamiejskich?

Przypomnij sobie, że kolumna metro przyjmuje jedną z dwóch wartości: "Metro" (obszary miejskie o wysokiej gęstości zaludnienia) lub "Nonmetro" (obszary podmiejskie i wiejskie).

counties_selected <- counties %>%
  select(state, metro, population)

Instrukcje 1/3

undefined XP
  • 1

    Dla każdej kombinacji state i metro oblicz łączną populację jako total_pop.

  • 2

    Wyodrębnij wiersz z największą populacją z każdego stanu – będzie to albo Metro, albo Nonmetro.

  • 3

    Rozgrupuj dane, a następnie zlicz, ile razy pojawia się Metro lub Nonmetro, aby sprawdzić, w ilu stanach więcej osób mieszka na danym typie obszaru.