1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Testování hypotéz v R

Connected

cvičení

Výpočet intervalů spolehlivosti

Pokud odhadneš hodnotu výběrové statistiky jediným číslem, nevyhnutelně se o něco mýlíš. Například předpokládaný podíl zpožděných zásilek byl 6 %. I když data nenasvědčují zamítnutí nulové hypotézy, že tento podíl je právě 6 %, u každého nového vzorku zásilek bude skutečný podíl trochu jiný. Proto je vhodné uvést interval spolehlivosti – tedy říct: „S 95% spolehlivostí se podíl zpožděných zásilek pohybuje mezi A a B" (pro nějaké konkrétní hodnoty A a B).

V kurzu Sampling in R jsou ukázány dva způsoby výpočtu intervalů spolehlivosti. Tady použiješ kvantily bootstrapového rozdělení.

K dispozici máš late_prop_samp a late_shipments_boot_distn; načtený je balíček dplyr.

Pokyny 1/2

undefined XP
    1
    2
  • Sumarizuj sloupec prop_late_shipments z late_shipments_boot_distn a vypočítej 95% interval spolehlivosti pomocí metody kvantilů. Dolní a horní hranici CI pojmenuj lower a upper.