Berechnung eines z-Scores
Da Variablen beliebige Spannweiten und Einheiten haben, müssen wir sie standardisieren. Ein Hypothesentest, der unterschiedliche Antworten liefert, wenn die Variablen in Euro statt in US-Dollar angegeben sind, wäre zum Beispiel nicht von großem Wert. Die Standardisierung verhindert so etwas.
Ein standardisierter Wert, der bei einem Hypothesentest von Interesse ist, wird als z-Score bezeichnet. Um ihn zu berechnen, brauchst du drei Zahlen: die Stichprobenstatistik (Punktschätzung), die hypothetische Statistik und den Standardfehler der Statistik (geschätzt aus der Bootstrap-Verteilung).
Die Stichprobenstatistik ist als late_prop_samp
verfügbar.
late_shipments_boot_distn
ist eine Bootstrap-Verteilung des Anteils der verspäteten Sendungen, die als Liste verfügbar ist.
pandas
und numpy
werden mit ihren üblichen Aliasnamen geladen.
Diese Übung ist Teil des Kurses
Hypothesentests in Python
Anleitung zur Übung
- Nimm die Hypothese an, dass der Anteil der verspäteten Sendungen 6 % beträgt.
- Berechne den Standardfehler aus der Standardabweichung der Bootstrap-Verteilung.
- Berechne den z-Score.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Hypothesize that the proportion is 6%
late_prop_hyp = ____
# Calculate the standard error
std_error = ____
# Find z-score of late_prop_samp
z_score = ____
# Print z_score
print(z_score)