La media delle medie
Vuoi sapere qual è il numero medio di utenti (num_users) per deal, ma ti serve questo valore per l’intera azienda, così da capire se i deal di Amir hanno più o meno utenti rispetto alla media aziendale. Il problema è che nell’ultimo anno l’azienda ha lavorato a più di diecimila deal, quindi non è realistico raccogliere tutti i dati. Al contrario, stimerai la media prendendo diversi campioni casuali di deal, perché è molto più semplice che raccogliere dati da tutta l’azienda.
amir_deals è disponibile e i dati sugli utenti per tutti i deal dell’azienda sono in all_deals. Sia pandas come pd sia numpy come np sono già caricati.
Questo esercizio fa parte del corso
Introduzione alla statistica in Python
Istruzioni dell'esercizio
- Imposta il seme casuale a
321. - Prendi 30 campioni (con reinserimento) di dimensione 20 da
all_deals['num_users']e calcola la media di ciascun campione. Salva le medie campionarie insample_means. - Stampa la media di
sample_means. - Stampa la media della colonna
num_usersdiamir_deals.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)