Calcolare la media campionaria
Il dataset late_shipments contiene dati della supply chain relativi alla consegna di forniture mediche. Ogni riga rappresenta la consegna di un componente. La colonna late indica se il componente è stato consegnato in ritardo oppure no. Un valore "Yes" significa che il componente è arrivato in ritardo, mentre un valore "No" indica che è stato consegnato puntualmente.
Inizierai l’analisi calcolando una stima puntuale (o statistica campionaria), cioè la proporzione di spedizioni in ritardo.
In pandas, la proporzione di un valore in una colonna categorica di un DataFrame può essere calcolata rapidamente con la sintassi:
prop = (df['col'] == val).mean()
late_shipments è disponibile e pandas è stato caricato come pd.
Questo esercizio fa parte del corso
Test di ipotesi in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the late_shipments dataset
____