Hypothesentest: Werden sie langsamer?
Jetzt testen wir die Nullhypothese, dass die Split-Zeit der Schwimmer überhaupt nicht mit der im Rennen zurückgelegten Distanz korreliert. Wir verwenden den Pearson-Korrelationskoeffizienten (berechnet mit dcst.pearson_r()) als Teststatistik.
Diese Übung ist Teil des Kurses
Fallstudien zum statistischen Denken
Anleitung zur Übung
- Berechne die beobachtete Pearson-Korrelation und speichere sie als
rho. - Initialisiere mit
np.empty()ein Array mit 10.000 Permutationsreplikaten der Pearson-Korrelation und nenne esperm_reps_rho. - Schreibe eine
for-Schleife, die Folgendes tut:- Mische das Array der Split-Nummern mit
np.random.permutation()und nenne esscrambled_split_number. - Berechne den Pearson-Korrelationskoeffizienten zwischen dem gemischten Split-Nummern-Array und den mittleren Split-Zeiten und speichere ihn in
perm_reps_rho.
- Mische das Array der Split-Nummern mit
- Berechne den p-Wert und gib ihn auf dem Bildschirm aus. Interpretiere „mindestens so extrem wie“ so, dass die Pearson-Korrelation mindestens so groß ist wie die beobachtete.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Observed correlation
rho = ____
# Initialize permutation reps
perm_reps_rho = ____
# Make permutation reps
for i in range(10000):
# Scramble the split number array
scrambled_split_number = ____
# Compute the Pearson correlation coefficient
____[i] = ____
# Compute and print p-value
p_val = ____(____ >= ____) / ____
print('p =', p_val)