Hypothesentest: Kann das Zufall sein?
Die EDA und die lineare Regressionsanalyse sind ziemlich eindeutig. Trotzdem rundest du die Analyse des Zickzack-Effekts ab, indem du die Hypothese testest, dass die Bahnzuweisung nichts mit dem mittleren relativen Unterschied zwischen geraden und ungeraden Bahnen zu tun hat – mithilfe eines Permutationstests. Du verwendest den Pearson-Korrelationskoeffizienten als Teststatistik, den du mit dcst.pearson_r() berechnen kannst. Die Variablen lanes und f_13 sind bereits in deinem Namespace.
Diese Übung ist Teil des Kurses
Fallstudien zum statistischen Denken
Anleitung zur Übung
- Berechne den beobachteten Pearson-Korrelationskoeffizienten und speichere ihn als
rho. - Initialisiere ein Array, um die 10.000 Permutations-Replikate von
rhomitnp.empty()zu speichern. Nenne das Arrayperm_reps_rho. - Schreibe eine
for-Schleife, um die Permutations-Replikate zu ziehen.- Mische das Array
lanesmitnp.random.permutation(). - Berechne den Pearson-Korrelationskoeffizienten zwischen dem gemischten
lanes-Array undf_13. Speichere das Ergebnis inperm_reps_rho.
- Mische das Array
- Berechne und gib den p-Wert aus. Interpretiere "mindestens so extrem wie" so, dass der Pearson-Korrelationskoeffizient größer oder gleich dem beobachteten Wert ist.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compute observed correlation: rho
rho = ____
# Initialize permutation reps: perm_reps_rho
perm_reps_rho = ____
# Make permutation reps
for i in range(10000):
# Scramble the lanes array: scrambled_lanes
scrambled_lanes = ____
# Compute the Pearson correlation coefficient
____[i] = ____
# Compute and print p-value
p_val = ____(____ >= ____) / 10000
print('p =', p_val)