Multivariate normale steekproeven
In deze oefening ga je verder met de house_price_size-DataFrame, die al voor je is ingeladen. Ter herinnering: house_price_size bevat twee kolommen, price en size, die respectievelijk de prijs en de grootte van huizen voorstellen.
Na het verkennen van de house_price_size-DataFrame vermoed je dat dit een multivariate normale verdeling is, omdat price en size elk een normale verdeling lijken te volgen. Op basis van de covariantiematrix die je in de vorige oefening hebt berekend, kun je nu steekproeven trekken uit een multivariate normale verdeling met een gedefinieerde covariatiestructuur!
Om multivariate normale steekproeven met een gedefinieerde covariantie uit te voeren, heb je de volgende informatie nodig:
priceheeft een gemiddelde van 20 ensizeheeft een gemiddelde van 500priceheeft een variantie van 19 ensizeheeft een variantie van 50.000- De covariantie tussen
priceensizeis 950 - Je neemt 5.000 steekproeven
De volgende imports zijn al voor je gedaan: seaborn als sns, pandas als pd, numpy als np, matplotlib.pyplot als plt en scipy.stats als st.
Deze oefening maakt deel uit van de cursus
Monte Carlo-simulaties in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Assign the mean of price and size, sample size, and covariance matrix of price and size
mean_value = ____
cov_mat = np.array(____)
sample_size = ____