SE s méně daty

Čím méně dat máš k dispozici pro odhad, tím větší bude nejistota tohoto odhadu. To se odráží ve standardní chybě. V tomto cvičení si vypěstuješ intuici pro tento vztah tím, že se podíváš na datasety různých velikostí.

Z datasetu gss2016 byly pro tebe vytvořeny dva nové, menší datasety: gss2016_small s 50 pozorováními a gss2016_smaller s pouhými 10 pozorováními.

1
- Pomocí datasetu gss2016_small vytvoř bootstrap rozdělení nazvané boot_dist_small podle obvyklých kroků:
- specify – urči, že tě zajímá proměnná consci, kde úspěch odpovídá hodnotě "High".
- generate – vygeneruj 500 bootstrap replikátů.
- calculate – pro každý z nich vypočítej proporci.

2
Shrň standardní chybu (SE) rozdělení boot_dist_small pomocí jeho směrodatné odchylky, vytáhni ji funkcí pull a ulož do proměnné SE_small_n.
3
- Zopakuj postup generování bootstrap rozdělení pro dataset gss2016_smaller a ulož ho do boot_dist_smaller. Ušetři si čas – zkopíruj předchozí blok kódu a zaměň název datasetu.
4
- Zopakuj postup extrakce SE z rozdělení boot_dist_smaller a ulož výsledek do SE_smaller_n. Zde se opět hodí kopírovat a vkládat.
- Spusť kód a porovnej obě hodnoty SE s příslušnými velikostmi vzorků. Jak velikost vzorku ovlivňuje standardní chybu?

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Instrukce 1/4

cvičení