Calcul de la moyenne de l'échantillon
L'ensemble de données late_shipments contient des données sur la chaîne d'approvisionnement concernant la livraison de fournitures médicales. Chaque ligne représente une livraison d'une pièce. Les colonnes late indiquent si la pièce a été livrée en retard ou non. La valeur "Yes" signifie que la pièce a été livrée en retard, et la valeur "No" signifie que la pièce a été livrée à temps.
Vous commencerez votre analyse en calculant une estimation ponctuelle (ou statistique d'échantillon), à savoir la proportion d'envois tardifs.
Dans pandas, la proportion d'une valeur dans une colonne DataFrame catégorique peut être rapidement calculée à l'aide de la syntaxe :
prop = (df['col'] == val).mean()
late_shipments est disponible et pandas est chargé en tant que pd.
Cet exercice fait partie du cours
<cours>Tests d'hypothèses en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Print the late_shipments dataset
____