1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Test hipotezy dla korelacji Pearsona

Obserwowana korelacja między analfabetyzmem kobiet a dzietnością może być dziełem przypadku – dzietność danego kraju może być całkowicie niezależna od poziomu analfabetyzmu. Sprawdzisz tę hipotezę. W tym celu przetasujesz wartości illiteracy, pozostawiając wartości fertility bez zmian. Symuluje to hipotezę, że obie zmienne są całkowicie od siebie niezależne. Dla każdej permutacji oblicz współczynnik korelacji Pearsona i oceń, ile replik permutacyjnych ma współczynnik korelacji Pearsona większy od obserwowanego.

Funkcja pearson_r(), którą napisano w poprzedniej części tego kursu do obliczania współczynnika korelacji Pearsona, jest już dostępna.

Instrukcje

100 XP
  • Oblicz obserwowaną korelację Pearsona między illiteracy a fertility.
  • Zainicjalizuj tablicę do przechowywania replik permutacyjnych.
  • Napisz pętlę for, która wygeneruje 10 000 replik:
    • Przetasuj wartości illiteracy za pomocą np.random.permutation().
    • Oblicz korelację Pearsona między przetasowaną tablicą illiteracy_permuted a fertility.
  • Oblicz i wyświetl wartość p wyznaczoną na podstawie replik.