1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Inference for Categorical Data in R

Connected

cvičení

Nulová hypotéza platí: rozhodnutí

V předchozím cvičení ležel pozorovaný rozdíl proporcí pohodlně uprostřed nulového rozdělení. V tomto cvičení dospěješ k formálnímu rozhodnutí, zda nulovou hypotézu zamítnout – ale místo p-hodnot použiješ koncept oblasti zamítnutí.

Oblast zamítnutí je rozsah hodnot statistiky, při kterých nulovou hypotézu zamítneš. U oboustranného testu existují dvě oblasti zamítnutí. Víš, že horní oblast by měla obsahovat největších 2,5 % nulových statistik (při alpha = .05), takže mezní hodnotu zjistíš pomocí funkce .975 quantile(). Podobně dolní oblast obsahuje nejmenších 2,5 % nulových statistik, což rovněž zjistíš pomocí quantile().

Tady je rychlý přehled toho, jak funkce quantile() funguje na jednoduchém datasetu x.

x <- c(0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20)
quantile(x, probs = .5)
quantile(x, probs = .8)

Jakmile budeš mít oblast zamítnutí definovanou horní a dolní mezní hodnotou, můžeš rozhodnout o nulové hypotéze tak, že zkontroluješ, zda pozorovaná statistika leží mezi těmito mezemi (v takovém případě nulovou hypotézu nezamítneš), nebo mimo ně (v takovém případě ji zamítneš).

Pokyny 1/2

undefined XP
    1
    2
  • Vytvoř objekt alpha s hodnotou 0.05.
  • Nalezni horní mezní hodnotu tak, že začneš s datovým rámcem null přeneseným z předchozího cvičení a shrneš sloupec stat pomocí kvantilu alpha / 2 funkce quantile(). Ulož tuto hodnotu jako lower. Poté nalezni kvantil 1 - alpha / 2 a ulož ho jako upper.
  • Ověř, zda pozorovaná hodnota d_hat leží between() mezi mezemi lower a upper, a zjisti tak, zda nulovou hypotézu nezamítneš.