1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wnioskowanie dla danych kategorycznych w R

Connected

ćwiczenie

Wartość p na dwa sposoby

Wiesz już, że rozkład zerowy można uzyskać na dwa sposoby: przez obliczenia i przez aproksymację matematyczną. Test zgodności chi-kwadrat nie jest wyjątkiem. Rozkładem aproksymacyjnym jest tu „rozkład chi-kwadrat" z liczbą stopni swobody równą liczbie kategorii minus jeden.

W tym ćwiczeniu porównasz oba podejścia, aby obliczyć wartość p mierzącą zgodność rozkładu pierwszych cyfr z danych irańskich z prawem Benforda. Zauważ, że statystyka obserwowana wyznaczona w poprzednim ćwiczeniu jest zapisana w przestrzeni roboczej jako chi_obs_stat.

Instrukcje 1/2

undefined XP
    1
    2
  • Oblicz stopnie swobody aproksymacji chi-kwadrat: pobierz wektor first_digit ze zbioru danych iran, wyznacz liczbę kategorii za pomocą funkcji nlevels(), a następnie odejmij jeden.
  • Używając null, wyrysuj rozkład statystyk chi-kwadrat jako wykres gęstości. Dodaj pionową linię oznaczającą obserwowaną statystykę, a następnie nałóż krzywą aproksymacji chi-kwadrat z obliczonymi stopniami swobody w kolorze niebieskim.