Statistiche del campione vs popolazione
In questo esercizio lavorerai con una population già caricata. Costruirai un sample estraendo punti a caso dalla popolazione. Calcolerai la media e la deviazione standard del campione prelevato da quella popolazione per verificare se il campione è rappresentativo della popolazione. L’obiettivo è vedere se le statistiche del campione coincidono o sono molto vicine a quelle della popolazione.

Questo esercizio fa parte del corso
Introduzione alla modellazione lineare in Python
Istruzioni dell'esercizio
- Calcola e stampa la media e la deviazione standard dei dati
population. - Usa il metodo
np.random.seed()per impostare a42il seed del generatore pseudocasuale dinumpy. - Usa
np.random.choice()per creare unsampleconsize=31, dove size è il numero di punti estratti dapopulation. - Calcola e stampa la media e la deviazione standard del
samplee confronta i valori stampati tra statistiche del campione e della popolazione per vedere se differiscono.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute the population statistics
print("Population mean {:.1f}, stdev {:.2f}".format( population.____(), population.____() ))
# Set random seed for reproducibility
____.____.____(42)
# Construct a sample by randomly sampling 31 points from the population
sample = np.____.____(____, size=31)
# Compare sample statistics to the population statistics
print(" Sample mean {:.1f}, stdev {:.2f}".format( sample.____(), sample.____() ))