1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Inference for Categorical Data in R

Connected

cvičení

SE s méně daty

Čím méně dat máš k dispozici pro odhad, tím větší bude nejistota tohoto odhadu. To se odráží ve standardní chybě. V tomto cvičení si vypěstuješ intuici pro tento vztah tím, že se podíváš na datasety různých velikostí.

Z datasetu gss2016 byly pro tebe vytvořeny dva nové, menší datasety: gss2016_small s 50 pozorováními a gss2016_smaller s pouhými 10 pozorováními.

Instrukce 1/4

undefined XP
  • 1
    • Pomocí datasetu gss2016_small vytvoř bootstrap rozdělení nazvané boot_dist_small podle obvyklých kroků:
    • specify – urči, že tě zajímá proměnná consci, kde úspěch odpovídá hodnotě "High".
    • generate – vygeneruj 500 bootstrap replikátů.
    • calculate – pro každý z nich vypočítej proporci.
  • 2

    Shrň standardní chybu (SE) rozdělení boot_dist_small pomocí jeho směrodatné odchylky, vytáhni ji funkcí pull a ulož do proměnné SE_small_n.

  • 3
    • Zopakuj postup generování bootstrap rozdělení pro dataset gss2016_smaller a ulož ho do boot_dist_smaller. Ušetři si čas – zkopíruj předchozí blok kódu a zaměň název datasetu.
  • 4
    • Zopakuj postup extrakce SE z rozdělení boot_dist_smaller a ulož výsledek do SE_smaller_n. Zde se opět hodí kopírovat a vkládat.
    • Spusť kód a porovnej obě hodnoty SE s příslušnými velikostmi vzorků. Jak velikost vzorku ovlivňuje standardní chybu?