1. Učit se
  2. /
  3. Projekty
  4. /
  5. Analýza dat amerického sčítání lidu v R

Connected

cvičení

Hledání největší skupiny podle okresu

Nástroje pro práci s daty z balíčků jako dplyr a purrr jsou při průzkumu dat ze sčítání lidu nesmírně výkonné. Balíček tidycensus je navržen přímo s ohledem na průzkum dat v prostředí tidyverse. Můžeš například zjistit, která rasová či etnická skupina je v každém okrese daného státu nejpočetnější. K tomu využiješ možnosti seskupování v dplyr, díky kterým snadno identifikuješ největší odhad skupiny z ACS a odfiltrování řádků odpovídajících té skupině.

Pokyny

100 XP
  • Seskup dataset ca_race podle sloupce GEOID.
  • Filtruj dataset tak, aby zůstaly pouze řádky, kde hodnota estimate odpovídá maximu v dané skupině (okresu).
  • Pomocí funkce tally() zjisti rozložení největších rasových a etnických skupin v okresech Kalifornie.