Variazione nelle statistiche del campione
Se crei un campione di size=1000 estraendo quel numero di punti da una popolazione, poi calcoli una statistica campionaria, come la media, ottieni un singolo valore che riassume il campione.
Se ripeti quel processo di campionamento num_samples=100 volte, ottieni 100 campioni. Calcolare la statistica campionaria, ad esempio la media, per ciascuno dei diversi campioni produrrà una distribuzione di valori della media. L’obiettivo è quindi calcolare la media delle medie e la deviazione standard delle medie.
Qui userai le variabili pre-caricate population, num_samples e num_pts; nota che gli array means e deviations sono stati inizializzati a zero per fornirti i contenitori da usare nel ciclo for.
Questo esercizio fa parte del corso
Introduzione alla modellazione lineare in Python
Istruzioni dell'esercizio
- Per ciascuno dei
num_samples=100, genera un campione, poi calcola e memorizza le statistiche campionarie. - A ogni iterazione, crea un
sampleusandonp.random.choice()per estrarre1000punti casuali dalla popolazione. - A ogni iterazione, calcola e salva i risultati dei metodi
sample.mean()esample.std()per ottenere la media e la deviazione standard del campione. - Per l’array di
meanse l’array dideviations, calcola sia la media sia la deviazione standard di ciascuno e stampa i risultati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Initialize two arrays of zeros to be used as containers
means = np.zeros(num_samples)
stdevs = np.zeros(num_samples)
# For each iteration, compute and store the sample mean and sample stdev
for ns in range(num_samples):
sample = np.____.choice(population, num_pts)
means[ns] = sample.____()
stdevs[ns] = sample.____()
# Compute and print the mean() and std() for the sample statistic distributions
print("Means: center={:>6.2f}, spread={:>6.2f}".format(means.mean(), means.std()))
print("Stdevs: center={:>6.2f}, spread={:>6.2f}".format(stdevs.____(), stdevs.____()))