Aan de slagGa gratis aan de slag

Multivariate normale steekproeven

In deze oefening ga je verder met de house_price_size-DataFrame, die al voor je is ingeladen. Ter herinnering: house_price_size bevat twee kolommen, price en size, die respectievelijk de prijs en de grootte van huizen voorstellen.

Na het verkennen van de house_price_size-DataFrame vermoed je dat dit een multivariate normale verdeling is, omdat price en size elk een normale verdeling lijken te volgen. Op basis van de covariantiematrix die je in de vorige oefening hebt berekend, kun je nu steekproeven trekken uit een multivariate normale verdeling met een gedefinieerde covariatiestructuur!

Om multivariate normale steekproeven met een gedefinieerde covariantie uit te voeren, heb je de volgende informatie nodig:

  • price heeft een gemiddelde van 20 en size heeft een gemiddelde van 500
  • price heeft een variantie van 19 en size heeft een variantie van 50.000
  • De covariantie tussen price en size is 950
  • Je neemt 5.000 steekproeven

De volgende imports zijn al voor je gedaan: seaborn als sns, pandas als pd, numpy als np, matplotlib.pyplot als plt en scipy.stats als st.

Deze oefening maakt deel uit van de cursus

Monte Carlo-simulaties in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Assign the mean of price and size, sample size, and covariance matrix of price and size
mean_value = ____
cov_mat = np.array(____)
sample_size = ____
Code bewerken en uitvoeren