LoslegenKostenlos loslegen

Hypothesentest zur Pearson-Korrelation

Die beobachtete Korrelation zwischen weiblichem Analphabetismus und Fertilität könnte reiner Zufall sein; die Fertilität eines Landes ist möglicherweise völlig unabhängig vom Analphabetismus. Genau diese Hypothese testest du jetzt. Permutiere dazu die Werte von illiteracy, lasse die Werte von fertility aber unverändert. So simulierst du die Hypothese, dass beide Größen vollkommen unabhängig voneinander sind. Berechne für jede Permutation den Pearson-Korrelationskoeffizienten und prüfe, wie viele deiner Permutationsreplikate einen Pearson-Korrelationskoeffizienten haben, der größer ist als der beobachtete.

Die Funktion pearson_r(), die du im ersten Teil dieses Kurses geschrieben hast, um den Pearson-Korrelationskoeffizienten zu berechnen, steht dir bereits zur Verfügung.

Diese Übung ist Teil des Kurses

Statistical Thinking in Python (Teil 2)

Kurs anzeigen

Anleitung zur Übung

  • Berechne die beobachtete Pearson-Korrelation zwischen illiteracy und fertility.
  • Initialisiere ein Array, um deine Permutationsreplikate zu speichern.
  • Schreibe eine for-Schleife, um 10.000 Replikate zu erzeugen:
    • Permutiere die Messwerte in illiteracy mit np.random.permutation().
    • Berechne die Pearson-Korrelation zwischen dem permutierten Array illiteracy_permuted und fertility.
  • Berechne den p-Wert aus den Replikaten und gib ihn aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Compute observed correlation: r_obs
r_obs = ____

# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)

# Draw replicates
for ____ in ____:
    # Permute illiteracy measurments: illiteracy_permuted
    illiteracy_permuted = ____

    # Compute Pearson correlation
    perm_replicates[i] = ____

# Compute p-value: p
p = ____
print('p-val =', p)
Code bearbeiten und ausführen