1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Hierarchické a smíšené modely s náhodnými efekty v R

Connected

Cvičení

Vizualizace dat o kriminalitě v Marylandu

Než začneš sestavovat model, může být velmi užitečné data nejprve vizualizovat – uvidíš, jestli vynikají nějaké trendy nebo datové body, jestli existují odlehlé hodnoty nebo jiné vlastnosti dat, které bude třeba zohlednit. S pomocí ggplot2 můžeš nakreslit linie pro každý okres a sledovat, jak se počty trestných činů mění v čase. V tomto cvičení prozkoumáš data o kriminalitě v Marylandu (md_crime). Datová sada obsahuje sloupec Year (rok), počet násilných trestných činů (Crime) v daném okrese a název okresu (County).

Nejprve vykresli datové body pro každý okres v čase – uvidíš tak, jak se každý okres vyvíjí. Místo estetiky color zde použij group, protože okresů je příliš mnoho a jejich barvy by se špatně rozlišovaly. Po vykreslení surových dat přidej pro každý okres trendové linie.

Spojené body (geom_line) i trendové linie (geom_smooth) ti napoví, jaké náhodné efekty (pokud vůbec nějaké) jsou potřeba. Pokud mají všechny body podobné rozsahy a průměry, nemusí být náhodný efekt pro intercept důležitý. Podobně, pokud trendy vypadají konzistentně napříč okresy (tj. trendové linie jsou si podobné nebo rovnoběžné), náhodný efekt pro slope nemusí být nutný.

Pokyny 1/2

undefined XP
    1
    2
  • Vykresli, jak se počet trestných činů Crime (proměnná y) měnil v průběhu let Year (proměnná x) v každém okrese County (proměnná group) s využitím dat md_crime.
  • Přidej trendové linie pro každý okres pomocí geom_smooth(method = 'lm', se = FALSE). Parametr se = FALSE zajistí přehlednější graf.