LoslegenKostenlos loslegen

Nullhypothese

In dieser Übung formulieren wir die Nullhypothese als:

kurze und lange Zeitdauern haben keinen Einfluss auf die insgesamt zurückgelegte Strecke.

Wir interpretieren die „Effektgröße null“ so, dass bei einem Durchmischen der Stichproben zwischen kurzen und langen Zeiten — sodass zwei neue Stichproben jeweils eine Mischung aus Fahrten mit kurzer und langer Dauer enthalten — der Teststatistik im Mittelwert null ist.

Dein Ziel in dieser Übung ist es, das Mischen und Resampling durchzuführen. Starte mit den vordefinierten group_duration_short und group_duration_long, das sind die ungemischten Gruppen nach Zeitdauer.

Diese Übung ist Teil des Kurses

Einführung in lineares Modellieren mit Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende np.concatenate(), um die beiden Populationen zu kombinieren, und nutze anschließend np.random.shuffle(), um die Werte in diesem Container zu mischen.
  • Teile den shuffle_bucket in zwei Hälften und verwende np.random.choice(), um jedes shuffle_half erneut zu sampeln.
  • Berechne die test_statistic, indem du resample_half1 von resample_half2 subtrahierst.
  • Berechne die effect_size als np.mean() der test_statistic und gib das Ergebnis aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Shuffle the time-ordered distances, then slice the result into two populations.
shuffle_bucket = np.____((group_duration_short, group_duration_long))
np.random.shuffle(____)
slice_index = len(shuffle_bucket)//2
shuffled_half1 = shuffle_bucket[0:____]
shuffled_half2 = shuffle_bucket[____:]

# Create new samples from each shuffled population, and compute the test statistic
resample_half1 = np.random.choice(____, size=500, replace=____)
resample_half2 = np.random.choice(____, size=500, replace=____)
test_statistic = ____ - ____

# Compute and print the effect size
effect_size = np.mean(____)
print('Test Statistic, after shuffling, mean = {}'.format(____))
Code bearbeiten und ausführen