1. 学ぶ
  2. /
  3. プロジェクト
  4. /
  5. Analýza dat amerického sčítání lidu v R

Connected

演習

Překódování proměnných a výpočet skupinových součtů

dplyr, jeden z klíčových balíčků tidyverse, nabízí řadu funkcí pro práci s daty. Umožňuje překódovávat datové sady, definovat v nich skupiny a provádět výpočty nad těmito skupinami. Takové operace se běžně řetězí pomocí roury, označené operátorem %>%.

V tomto cvičení budeš pracovat s daty ACS v typickém tidyverse workflow. Identifikuješ proměnné mediánového příjmu domácností z tabulky ACS B19001, které jsou nižší než 35 000 \(, mezi 35 000 \) a 75 000 \( a nad 75 000 \). Potom spočítáš, kolik domácností spadá do každé skupiny pro jednotlivé okresy ve Washingtonu.

指示

100 XP
  • Odfiltruj řádky, kde se proměnná rovná "B19001_001" – ta totiž představuje celkový počet domácností.
  • Pomocí funkce case_when() vytvoř sloupec incgroup, který použiješ k definování překódovaných skupin.
  • Pomocí funkce group_by() seskup datovou sadu podle názvu okresu a příjmové skupiny.
  • Nakonec použij funkci summarize() k výpočtu skupinových součtů podle okresu a zkontroluj výsledek.