De steekproefgemiddelde berekenen
De late_shipments-gegevensset bevat supplychaingegevens over de levering van medische hulpmiddelen. Elke rij staat voor één levering van een onderdeel. De kolom late geeft aan of het onderdeel te laat is geleverd. Een waarde "Yes" betekent dat het onderdeel te laat is geleverd, en een waarde "No" betekent dat het onderdeel op tijd is geleverd.
Je begint je analyse met het berekenen van een puntschatting (of steekproefstatistiek): de proportie te late leveringen.
In pandas kun je de proportie van een waarde in een categorische DataFrame-kolom snel berekenen met:
prop = (df['col'] == val).mean()
late_shipments is beschikbaar en pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Hypothesetoetsen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the late_shipments dataset
____