De steekproefgemiddelde berekenen
De late_shipments-gegevensset bevat supplychaingegevens over de levering van medische hulpmiddelen. Elke rij staat voor één levering van een onderdeel. De kolom late geeft aan of het onderdeel te laat is geleverd. Een waarde "Yes" betekent dat het onderdeel te laat is geleverd, en een waarde "No" betekent dat het onderdeel op tijd is geleverd.
Je begint je analyse met het berekenen van een puntschatting (of steekproefstatistiek): de proportie te late leveringen.
In pandas kun je de proportie van een waarde in een categorische DataFrame-kolom snel berekenen met:
prop = (df['col'] == val).mean()
late_shipments is beschikbaar en pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Hypothesetoetsen in Python
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Print the late_shipments dataset
____