Problem wielokrotnych porównań

Problem wielokrotnych porównań pojawia się, gdy badacz wielokrotnie sprawdza różne zmienne lub próbki pod kątem istotności statystycznej. Czysto przypadkowo możemy od czasu do czasu natrafić na wynik uznawany za statystycznie istotny.

W tym ćwiczeniu będziesz pracować z danymi dotyczącymi wynagrodzeń pracowników Urzędu Miasta Austin w Teksasie. Porównasz te wynagrodzenia z losowo wygenerowanymi danymi i zobaczysz, jak często takie losowe dane okazują się „istotne" w wyjaśnianiu zarobków pracowników. Oczywiście każda taka „istotność" byłaby pozorna – liczby losowe raczej niczego nie wyjaśniają!

Ramka danych z wynagrodzeniami funkcjonariuszy policji (police_salaries_df) jest już wczytana, podobnie jak pakiety: pandas jako pd, NumPy jako np, Matplotlib jako plt oraz stats z SciPy.

To ćwiczenie jest częścią kursu

Podstawy wnioskowania statystycznego w Pythonie

Instrukcje do ćwiczenia

Zapisz liczbę osób w zbiorze danych w zmiennej n_rows (każdy wiersz to jedna osoba) i zainicjuj liczbę istotnych wyników, n_significant, wartością zero.
Napisz pętlę for, która wykona się 1000 razy i za każdym razem wygeneruje n_rows liczb losowych.
Oblicz współczynnik R Pearsona oraz odpowiadającą mu p-wartość między wygenerowanymi liczbami a wynagrodzeniami funkcjonariuszy policji.
Jeśli p-wartość jest istotna na poziomie 5%, dodaj jeden do n_significant za pomocą operatora +=.

Interaktywne ćwiczenie praktyczne

Spróbuj tego ćwiczenia, uzupełniając ten przykładowy kod.

# Compute number of rows and initialize n_significant
n_rows = ____
n_significant = ____

# For loop which generates n_rows random numbers 1000 times
for i in ____:
  random_nums = np.random.uniform(size=____)
  # Compute correlation between random_nums and police salaries
  r, p_value = stats.____(____, random_nums)
  # If the p-value is significant at 5%, increment n_significant
  if ____ < ____:
    ____ += 1
    
print(n_significant)

Edytuj i uruchom kod

To ćwiczenie jest częścią kursu

Podstawy wnioskowania statystycznego w Pythonie

SkillTag.level.advancedSkillTag.label

4.9+

Rozpocznij kurs za darmo

W tym rozdziale przyjrzymy się zależności między próbami a statystycznie uzasadnionymi wnioskami. Dobór próby stanowi podstawę trafnych decyzji statystycznych, a ty przekonasz się, jak wybór próby wpływa na wyniki wnioskowania.

Exercise 1: Wnioskowanie statystyczne i losowanie próby Exercise 2: Próbkowanie i estymatory punktowe Exercise 3: Wielokrotne próbkowanie, estymatory punktowe i wnioskowanie Exercise 4: Próbkowanie i błąd systematyczny Exercise 5: Wizualizacja próbek Exercise 6: Wnioskowanie i obciążenie Exercise 7: Przedziały ufności i próbkowanie Exercise 8: Normalne rozkłady próbkowania Exercise 9: Obliczanie przedziałów ufności Exercise 10: Wyciąganie wniosków z próbek

Naucz się stosować testy normalności, testy korelacji oraz testy parametryczne i nieparametryczne na potrzeby rzetelnego wnioskowania. Testy hipotez to narzędzia – wybór właściwego narzędzia do danego zadania jest kluczowy w statystycznym podejmowaniu decyzji. Nawet jeśli znasz już niektóre z tych testów z kursów wprowadzających, w tym rozdziale zagłębisz się w temat i rozbudujesz swój warsztat wnioskowania.

Exercise 1: Testy normalności Exercise 2: Testowanie normalności Exercise 3: Rozkład błędów Exercise 4: Dopasowywanie rozkładu normalnego Exercise 5: Testy korelacji Exercise 6: Testowanie korelacji Exercise 7: Autokorelacja Exercise 8: Wyjaśniona wariancja Exercise 9: Testy parametryczne Exercise 10: Równość wariancji Exercise 11: Normalność w grupach Exercise 12: ANOVA Exercise 13: Testy nieparametryczne Exercise 14: Porównywanie rankingów Exercise 15: Porównywanie median

W tym rozdziale zmierzysz i zinterpretujesz wielkość efektu w różnych sytuacjach, zetkniesz się z problemem wielokrotnych porównań i dogłębnie poznasz moc testu. Wartości p mówią ci, czy istotny efekt w ogóle występuje, ale nie informują o jego sile. Wielkość efektu mierzy, jak silny wpływ ma dane działanie. Opanuj czynniki decydujące o wielkości efektu w tym rozdziale.

Exercise 1: Wielkość efektu Exercise 2: Wielkość efektu dla średnich Exercise 3: Wielkość efektu dla korelacji Exercise 4: Wielkość efektu dla zmiennych kategorycznych Exercise 5: Wielokrotne porównania i korekty Exercise 6: Problem wielokrotnych porównań

Bieżące ćwiczenie

Exercise 7: Korekcja Bonferroniego-Holma Exercise 8: Moc testu Exercise 9: Czym właściwie jest moc testu?Exercise 10: Moc testu w projektowaniu eksperymentów Exercise 11: Obliczanie mocy testu i wielkości próby

Jeszcze bardziej rozbudujesz swój warsztat statystyki wnioskowania, poznając bootstrapping, testy permutacyjne i metody łączenia dowodów z wartości p. Bootstrapping da ci pierwsze spojrzenie na symulację statystyczną. W lekcji dotyczącej metaanalizy dowiesz się, jak łączyć wyniki wielu badań. Na koniec przyjrzysz się testom permutacyjnym – potężnemu i elastycznemu nieparametrycznemu narzędziu statystycznemu.

Exercise 1: Bootstrapping Exercise 2: Bootstrapowe przedziały ufności Exercise 3: Bootstrapping a normalność Exercise 4: Łączenie dowodów z wartości p Exercise 5: Metoda Fishera w SciPy Exercise 6: Wnioskowanie metodą Fishera Exercise 7: Podsumowanie metody Fishera Exercise 8: Testy permutacyjne Exercise 9: Testy permutacyjne dla korelacji Exercise 10: Testy permutacyjne i bootstrapping Exercise 11: Analiza skośnych danych za pomocą testu permutacyjnego Exercise 12: Podsumowanie kursu – wideo