Estimation des paramètres de la population
Imaginez une constellation (« population ») de satellites en orbite pendant une année complète, et la distance parcourue chaque heure est mesurée en kilomètres. Il existe une variation d’une heure à l’autre dans les distances mesurées, due à des complications inconnues de la dynamique orbitale. Supposons que vous ne puissiez pas mesurer toutes les données de l’année, mais que vous souhaitiez construire un modèle de population pour les variations de distance orbitale par heure (vitesse) à partir d’un échantillon de mesures.
Dans cet exercice, vous supposerez que la population des distances horaires est mieux modélisée par une loi gaussienne, et vous supposerez en outre que les paramètres de ce modèle de population peuvent être estimés à partir des statistiques de l’échantillon. Commencez avec sample_distances, préchargé, prélevé sur une population de satellites.


Cet exercice fait partie du cours
Introduction à la modélisation linéaire en Python
Instructions
- Calculez la moyenne et l’écart type de
sample_distances. - Utilisez les statistiques d’échantillon,
meanetstdev, comme bonnes estimations des paramètresmuetsigmad’un modèle de population. - Passez ces valeurs, ainsi que
sample_distances, à la fonctiongaussian_model()prédéfinie pour construire le modèle de population. - Utilisez
plot_model_and_data()(prédéfini) pour tracer ensemble l’échantillon et le modèle de population.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the mean and standard deviation of the sample_distances
sample_mean = np.mean(____)
sample_stdev = np.std(____)
# Use the sample mean and stdev as estimates of the population model parameters mu and sigma
population_model = gaussian_model(____, mu=____, sigma=____)
# Plot the model and data to see how they compare
fig = plot_data_and_model(sample_distances, population_model)