1. Učit se
  2. /
  3. Projekty
  4. /
  5. Analýza dat amerického sčítání lidu v R

Connected

cvičení

Prozkoumání chybových rozpětí

Data z ACS se od dat ze sčítání lidu liší tím, že jde o odhady doplněné o příslušné chybové rozpětí. Chybová rozpětí v ACS standardně odpovídají 90% intervalu spolehlivosti okolo daného odhadu – to znamená, že s 90% jistotou leží skutečná hodnota v rozsahu uvedeného odhadu plus/minus uvedené chybové rozpětí.

V tomto cvičení si vyzkoušíš práci s daty, u nichž jsou chybová rozpětí vysoká vzhledem k samotným odhadům. Jako příklad použijeme chudobu obyvatel ve věku 75 let a starších podle sčítacích obvodů (Census tracts) ve státě Vermont.

Pokyny

100 XP
  • Načti datovou sadu o chudobě seniorů podle sčítacích obvodů ve státě Vermont z ACS.
  • Vyfiltruj datový rámec tak, aby nový datový rámec obsahoval pouze řádky, kde chybové rozpětí převyšuje hodnotu odhadu.
  • Vyděl počet řádků v moe_check počtem řádků v původní datové sadě, abys zjistil/a, jaký podíl řádků má chybové rozpětí větší než odpovídající odhad.