1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v R

Connected

cvičení

Souhrnné statistiky pro různé typy vzorků

Máš k dispozici tři typy vzorků (prostý náhodný, stratifikovaný a klastrový) a teď je můžeš porovnat s parametry celé populace. Jinými slovy – vypočítáš stejnou souhrnnou statistiku pro každý vzorek a uvidíš, jak se liší od statistiky pro celou populaci.

Zaměříme se na to, jak spokojenost s firmou ovlivňuje odchod zaměstnanců. Konkrétně vypočítáš podíl zaměstnanců, kteří firmu opustili (jejich hodnota Attrition je "Yes"), pro každou hodnotu RelationshipSatisfaction.

K dispozici máš attrition_pop, attrition_srs, attrition_strat a attrition_clust; balíček dplyr je načtený.

Instrukce 1/4

undefined XP
  • 1
    • Seskup data podle úrovně RelationshipSatisfaction.
    • Pomocí summarize vytvoř sloupec mean_attrition jako průměr případů, kdy se Attrition rovná "Yes".
  • 2
    • Vypočítej podíl odchodů zaměstnanců pro každou skupinu spokojenosti se vztahy, tentokrát na prostém náhodném vzorku attrition_srs.
  • 3
    • Vypočítej podíl odchodů zaměstnanců pro každou skupinu spokojenosti se vztahy, tentokrát na stratifikovaném vzorku attrition_strat.
  • 4
    • Vypočítej podíl odchodů zaměstnanců pro každou skupinu spokojenosti se vztahy, tentokrát na klastrovém vzorku attrition_clust.