Échantillonnage selon une loi normale multivariée
Dans cet exercice, vous continuez à travailler avec le DataFrame house_price_size, qui a été chargé pour vous. Pour rappel, house_price_size contient deux colonnes, price et size, représentant respectivement le prix et la superficie des maisons.
Après avoir exploré le DataFrame house_price_size, vous soupçonnez qu’il suit une loi normale multivariée, car price et size semblent chacun suivre une loi normale. En vous appuyant sur la matrice de covariance calculée dans l’exercice précédent, vous pouvez désormais effectuer un échantillonnage selon une loi normale multivariée avec une structure de covariance définie !
Pour réaliser cet échantillonnage avec covariance définie, vous aurez besoin des informations suivantes :
pricea une moyenne de 20 etsizea une moyenne de 500pricea une variance de 19 etsizea une variance de 50 000- La covariance entre
priceetsizeest de 950 - Vous effectuerez 5 000 tirages
Les imports suivants ont été effectués pour vous : seaborn sous le nom sns, pandas sous le nom pd, numpy sous le nom np, matplotlib.pyplot sous le nom plt, et scipy.stats sous le nom st.
Cet exercice fait partie du cours
Simulations de Monte Carlo en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Assign the mean of price and size, sample size, and covariance matrix of price and size
mean_value = ____
cov_mat = np.array(____)
sample_size = ____