Nullhypothese
In dieser Übung formulieren wir die Nullhypothese als:
kurze und lange Zeitdauern haben keinen Einfluss auf die insgesamt zurückgelegte Strecke.
Wir interpretieren die „Effektgröße null“ so, dass bei einem Durchmischen der Stichproben zwischen kurzen und langen Zeiten — sodass zwei neue Stichproben jeweils eine Mischung aus Fahrten mit kurzer und langer Dauer enthalten — der Teststatistik im Mittelwert null ist.
Dein Ziel in dieser Übung ist es, das Mischen und Resampling durchzuführen. Starte mit den vordefinierten group_duration_short und group_duration_long, das sind die ungemischten Gruppen nach Zeitdauer.
Diese Übung ist Teil des Kurses
Einführung in lineares Modellieren mit Python
Anleitung zur Übung
- Verwende
np.concatenate(), um die beiden Populationen zu kombinieren, und nutze anschließendnp.random.shuffle(), um die Werte in diesem Container zu mischen. - Teile den
shuffle_bucketin zwei Hälften und verwendenp.random.choice(), um jedesshuffle_halferneut zu sampeln. - Berechne die
test_statistic, indem duresample_half1vonresample_half2subtrahierst. - Berechne die
effect_sizealsnp.mean()dertest_statisticund gib das Ergebnis aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Shuffle the time-ordered distances, then slice the result into two populations.
shuffle_bucket = np.____((group_duration_short, group_duration_long))
np.random.shuffle(____)
slice_index = len(shuffle_bucket)//2
shuffled_half1 = shuffle_bucket[0:____]
shuffled_half2 = shuffle_bucket[____:]
# Create new samples from each shuffled population, and compute the test statistic
resample_half1 = np.random.choice(____, size=500, replace=____)
resample_half2 = np.random.choice(____, size=500, replace=____)
test_statistic = ____ - ____
# Compute and print the effect size
effect_size = np.mean(____)
print('Test Statistic, after shuffling, mean = {}'.format(____))