Statistiche del campione vs popolazione

In questo esercizio lavorerai con una population già caricata. Costruirai un sample estraendo punti a caso dalla popolazione. Calcolerai la media e la deviazione standard del campione prelevato da quella popolazione per verificare se il campione è rappresentativo della popolazione. L’obiettivo è vedere se le statistiche del campione coincidono o sono molto vicine a quelle della popolazione.

Questo esercizio fa parte del corso

Introduzione alla modellazione lineare in Python

Visualizza corso

Istruzioni dell'esercizio

Calcola e stampa la media e la deviazione standard dei dati population.
Usa il metodo np.random.seed() per impostare a 42 il seed del generatore pseudocasuale di numpy.
Usa np.random.choice() per creare un sample con size=31, dove size è il numero di punti estratti da population.
Calcola e stampa la media e la deviazione standard del sample e confronta i valori stampati tra statistiche del campione e della popolazione per vedere se differiscono.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Compute the population statistics
print("Population mean {:.1f}, stdev {:.2f}".format( population.____(), population.____() ))

# Set random seed for reproducibility
____.____.____(42)

# Construct a sample by randomly sampling 31 points from the population
sample = np.____.____(____, size=31)

# Compare sample statistics to the population statistics
print("    Sample mean {:.1f}, stdev {:.2f}".format( sample.____(), sample.____() ))

Modifica ed esegui il codice