1. 学ぶ
  2. /
  3. コース
  4. /
  5. Manipulace s daty pomocí dplyr

Connected

演習

Kombinace summarize, slice_max a count

V této kapitole ses naučil/a používat šest funkcí z balíčku dplyr pro agregaci dat: count(), group_by(), summarize(), ungroup(), slice_max() a slice_min(). V tomto cvičení je zkombinuješ, abys odpověděl/a na otázku:

V kolika státech žije více lidí v metropolitních oblastech než v nemetropolitních?

Sloupec metro nabývá jedné ze dvou hodnot: "Metro" (hustě osídlená městská oblast) nebo "Nonmetro" (příměstské a venkovské oblasti).

counties_selected <- counties %>%
  select(state, metro, population)

指示1 / 3

undefined XP
  • 1

    Pro každou kombinaci state a metro zjisti celkovou populaci jako total_pop.

  • 2

    Z každého státu vyber řádek s nejvyšší populací — bude to buď Metro, nebo Nonmetro.

  • 3

    Odeskupuj data a pak spočítej, jak často se vyskytuje Metro nebo Nonmetro, abys zjistil/a, v kolika státech žije více lidí v dané oblasti.