Probleem van multiple comparisons

Het probleem van multiple comparisons ontstaat wanneer een onderzoeker herhaaldelijk verschillende variabelen/steekproeven met elkaar vergelijkt op significantie. Door toeval alleen al verwachten we af en toe een resultaat dat statistisch significant lijkt.

In deze oefening werk je met salarisgegevens van werknemers van de City of Austin, TX. Je vergelijkt hun salarissen met willekeurig gegenereerde data. Je ziet hoe vaak deze willekeurige data "significant" is in het verklaren van de salarissen van werknemers. Duidelijk is dat zo'n "significantie" schijn is, want willekeurige getallen helpen niet echt om iets te verklaren!

Een DataFrame met salarissen van politieagenten (police_salaries_df) is voor je geladen, net als de pakketten pandas als pd, NumPy als np, Matplotlib als plt, en stats uit SciPy.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in Python

Oefeninstructies

Sla het aantal mensen in de gegevensset op in n_rows (elke rij is een persoon), en initialiseer het aantal significante resultaten, n_significant, op nul.
Schrijf een for-lus die 1000 keer draait en n_rows willekeurige getallen genereert.
Bereken Pearson's R en de bijbehorende p-waarde tussen deze willekeurig gegenereerde getallen en de salarissen van de politieagenten.
Als de p-waarde significant is op 5%, tel er dan één bij op bij n_significant met de +=-operator.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Compute number of rows and initialize n_significant
n_rows = ____
n_significant = ____

# For loop which generates n_rows random numbers 1000 times
for i in ____:
  random_nums = np.random.uniform(size=____)
  # Compute correlation between random_nums and police salaries
  r, p_value = stats.____(____, random_nums)
  # If the p-value is significant at 5%, increment n_significant
  if ____ < ____:
    ____ += 1
    
print(n_significant)

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Basis van inferentie in Python

SkillTag.level.advancedSkillTag.label

4.9+

Begin gratis met de cursus

In dit hoofdstuk verkennen we de relatie tussen steekproeven en statistisch verantwoorde conclusies. De keuze van een steekproef is de basis voor degelijke statistische beslissingen, en we onderzoeken hoe die keuze de uitkomst van je inferentie beïnvloedt.

Exercise 1: Statistische inferentie en aselecte steekproeven Exercise 2: Steekproeven en puntschattingen Exercise 3: Herhaald steekproeven nemen, puntschattingen en inferentie Exercise 4: Steekproeven en bias Exercise 5: Steekproeven visualiseren Exercise 6: Inferentie en bias Exercise 7: Betrouwbaarheidsintervallen en steekproeven Exercise 8: Normale steekproefverdelingen Exercise 9: Betrouwbaarheidsintervallen berekenen Exercise 10: Conclusies trekken uit steekproeven

Leer alles over het toepassen van normaliteitstoetsen, correlatietoetsen en parametrische en niet-parametrische toetsen voor verantwoorde inferentie. Hypothesetoetsen zijn hulpmiddelen, en het kiezen van het juiste gereedschap is cruciaal voor statistische besluitvorming. Hoewel je sommige van deze toetsen misschien kent uit inleidende cursussen, ga je in dit hoofdstuk een stap verder om je inferentiële toolkit uit te breiden.

Exercise 1: Normaliteitstoetsen Exercise 2: Toetsen op normaliteit Exercise 3: Verdeling van fouten Exercise 4: Een normale verdeling fitten Exercise 5: Correlatietests Exercise 6: Correlatie testen Exercise 7: Autocorrelatie Exercise 8: Verklaarde variantie Exercise 9: Parametrische toetsen Exercise 10: Gelijke variantie Exercise 11: Normaliteit per groep Exercise 12: ANOVA Exercise 13: Niet-parametrische toetsen Exercise 14: Ranglijsten vergelijken Exercise 15: Mediaanwaarden vergelijken

In dit hoofdstuk meet en interpreteer je effectgrootte in verschillende situaties, maak je kennis met het multiple-comparisons-probleem en verken je de power van een toets in detail. Hoewel p-waarden aangeven of er een significant effect is, vertellen ze je niet hoe sterk dat effect is. Effectgrootte meet hoe sterk het effect van een behandeling is. Beheers de factoren die ten grondslag liggen aan effectgrootte in dit hoofdstuk.

Exercise 1: Effectgrootte Exercise 2: Effectgrootte voor gemiddelden Exercise 3: Effectgrootte voor correlaties Exercise 4: Effectgrootte voor categorische variabelen Exercise 5: Meerdere vergelijkingen en correcties Exercise 6: Probleem van multiple comparisons

Huidige oefening

Exercise 7: Bonferonni-Holm-correctie Exercise 8: Power van een toets Exercise 9: Wat is power eigenlijk?Exercise 10: Power voor experimenteel ontwerp Exercise 11: Power en steekproefgroottes berekenen

Je breidt je inferentiële statistiektoolkit verder uit met een blik op bootstrapping, permutatietoetsen en methoden om bewijs uit p-waarden te combineren. Bootstrapping geeft je een eerste kennismaking met statistische simulatie. In de les over meta-analyse leer je alles over het combineren van resultaten uit meerdere studies. Je sluit af met een kijk op permutatietoetsen, een krachtig en flexibel niet-parametrisch statistisch hulpmiddel.

Exercise 1: Bootstrappen Exercise 2: Bootstrap-betrouwbaarheidsintervallen Exercise 3: Bootstrapping vs. normaliteit Exercise 4: Bewijs combineren op basis van p-waarden Exercise 5: Fisher's methode in SciPy Exercise 6: Inferentie met de methode van Fisher Exercise 7: De methode van Fisher samengevat Exercise 8: Permutatietests Exercise 9: Permutatietests voor correlaties Exercise 10: Permutatietests en bootstrapping Exercise 11: Scheve data analyseren met een permutationtest Exercise 12: Afsluitende video van de cursus