1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Inference for Categorical Data in R

Connected

cvičení

Sestrojení intervalu spolehlivosti

Viděl/a jsi jeden příklad toho, jak se může p-hat měnit při resamplingu, ale abychom dobře odhadli jeho variabilitu, musíme tento postup zopakovat mnohokrát. Zde sestavíš celé bootstrapové rozdělení pro odhad směrodatné chyby (SE), která poslouží k vytvoření intervalu spolehlivosti. K zefektivnění výpočtu statistik z mnoha datových sad využiješ další funkci z balíčku infer: calculate().

Chvíli si prohlédni výstup funkce calculate(). Tato funkce zredukuje tvůj datový rámec na pouhé dva sloupce: jeden pro hodnoty "stat" a druhý pro příslušný "replicate".

Až si bootstrapové rozdělení zobrazíš, zjistíš, že má tvar zvonu. Právě tento tvar ti umožňuje přičíst a odečíst dvě SE a získat tak 95% interval.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vytvoř bootstrapové rozdělení s názvem boot_dist pomocí těchto kroků:
  • Pomocí specify urči, že tě zajímá proměnná consci, kde úspěch odpovídá hodnotě "High".
  • Pomocí generate vygeneruj 500 bootstrapových replikátů.
  • Pomocí calculate spočítej proporci nastavením stat na "prop".