Hypothesentest zur Pearson-Korrelation
Die beobachtete Korrelation zwischen weiblichem Analphabetismus und Fertilität könnte reiner Zufall sein; die Fertilität eines Landes ist möglicherweise völlig unabhängig vom Analphabetismus. Genau diese Hypothese testest du jetzt. Permutiere dazu die Werte von illiteracy, lasse die Werte von fertility aber unverändert. So simulierst du die Hypothese, dass beide Größen vollkommen unabhängig voneinander sind. Berechne für jede Permutation den Pearson-Korrelationskoeffizienten und prüfe, wie viele deiner Permutationsreplikate einen Pearson-Korrelationskoeffizienten haben, der größer ist als der beobachtete.
Die Funktion pearson_r(), die du im ersten Teil dieses Kurses geschrieben hast, um den Pearson-Korrelationskoeffizienten zu berechnen, steht dir bereits zur Verfügung.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 2)
Anleitung zur Übung
- Berechne die beobachtete Pearson-Korrelation zwischen
illiteracyundfertility. - Initialisiere ein Array, um deine Permutationsreplikate zu speichern.
- Schreibe eine
for-Schleife, um 10.000 Replikate zu erzeugen:- Permutiere die Messwerte in
illiteracymitnp.random.permutation(). - Berechne die Pearson-Korrelation zwischen dem permutierten Array
illiteracy_permutedundfertility.
- Permutiere die Messwerte in
- Berechne den p-Wert aus den Replikaten und gib ihn aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compute observed correlation: r_obs
r_obs = ____
# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)
# Draw replicates
for ____ in ____:
# Permute illiteracy measurments: illiteracy_permuted
illiteracy_permuted = ____
# Compute Pearson correlation
perm_replicates[i] = ____
# Compute p-value: p
p = ____
print('p-val =', p)