Visualiser la variabilité d’une statistique
Vous avez déjà calculé la variabilité de statistiques d’échantillon. Vous allez maintenant la visualiser.
Nous partons d’une population préchargée et d’une fonction prédéfinie get_sample_statistics() pour tirer des échantillons et renvoyer les tableaux des statistiques d’échantillon.
Ici, nous allons utiliser une fonction prédéfinie plot_hist() qui encapsule la méthode matplotlib axis.hist(), laquelle regroupe en classes et trace le tableau fourni. Vous verrez ainsi que les statistiques d’échantillon suivent une distribution de valeurs, et non une seule valeur.
Cet exercice fait partie du cours
Introduction à la modélisation linéaire en Python
Instructions
- Passez la
populationàget_sample_statistics()pour obtenir les distributions des statistiques d’échantillon. - Utilisez
np.linspace()pour définir les bords de classes de l’histogramme pour chaque tableau de statistiques. - Utilisez deux fois la fonction prédéfinie
plot_hist()pour tracer séparément les distributions des statistiquesmeansetdeviationssous forme de deux histogrammes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate sample distribution and associated statistics
means, stdevs = get_sample_statistics(____, num_samples=100, num_pts=1000)
# Define the binning for the histograms
mean_bins = np.____(97.5, 102.5, 51)
std_bins = np.____(7.5, 12.5, 51)
# Plot the distribution of means, and the distribution of stdevs
fig = plot_hist(data=____, bins=____, data_name="Means", color='green')
fig = plot_hist(data=____, bins=____, data_name="Stdevs", color='red')