IniziaInizia gratis

La media delle medie

Vuoi sapere qual è il numero medio di utenti (num_users) per deal, ma ti serve questo valore per l’intera azienda, così da capire se i deal di Amir hanno più o meno utenti rispetto alla media aziendale. Il problema è che nell’ultimo anno l’azienda ha lavorato a più di diecimila deal, quindi non è realistico raccogliere tutti i dati. Al contrario, stimerai la media prendendo diversi campioni casuali di deal, perché è molto più semplice che raccogliere dati da tutta l’azienda.

amir_deals è disponibile e i dati sugli utenti per tutti i deal dell’azienda sono in all_deals. Sia pandas come pd sia numpy come np sono già caricati.

Questo esercizio fa parte del corso

Introduzione alla statistica in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Imposta il seme casuale a 321.
  • Prendi 30 campioni (con reinserimento) di dimensione 20 da all_deals['num_users'] e calcola la media di ciascun campione. Salva le medie campionarie in sample_means.
  • Stampa la media di sample_means.
  • Stampa la media della colonna num_users di amir_deals.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)
Modifica ed esegui il codice