Berechnung des Mittelwerts der Stichprobe
Der Datensatz late_shipments
enthält Lieferkettendaten über die Lieferung von medizinischen Hilfsmitteln. Jede Zeile steht für eine Lieferung eines Artikels. Die Spalte late
gibt an, ob der Artikel verspätet geliefert wurde oder nicht. Ein Wert von "Yes"
bedeutet, dass der Artikel zu spät geliefert wurde, und ein Wert von "No"
bedeutet, dass der Artikel pünktlich geliefert wurde.
Du beginnst deine Analyse, indem du eine Punktschätzung (oder eine Stichprobenstatistik) berechnest, nämlich den Anteil der verspäteten Sendungen.
In pandas
kann der Anteil eines Wertes in einer kategorialen DataFrame-Spalte schnell mit dieser Syntax berechnet werden:
prop = (df['col'] == val).mean()
Der DataFrame late_shipments
ist verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Hypothesentests in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Print the late_shipments dataset
____