Aan de slagGa gratis aan de slag

Normale verdeling

Door naar de meest herkenbare en nuttige verdeling: de normale ofwel Gaussische verdeling. In de dia's hebben we kort de klokvorm besproken en hoe de normale verdeling samen met de centrale limietstelling ons in staat stelt hypothesetoetsen uit te voeren.

Net als in de vorige oefeningen ga je hier eerst data simuleren en de verdeling bekijken. Daarna ga je een laagje dieper en onderzoek je de kans op bepaalde observaties.

Deze oefening maakt deel uit van de cursus

Statistiek-vragen voor sollicitaties oefenen in Python

Cursus bekijken

Oefeninstructies

  • Genereer de data voor de verdeling met de functie rvs() met size op 1000; sla dit op in de variabele data.
  • Toon een matplotlib-histogram; bekijk de vorm van de verdeling.
  • Gegeven een gestandaardiseerde normale verdeling, wat is de kans op een observatie groter dan 2?
  • Kijkend naar ónze steekproef, wat is de kans op een observatie groter dan 2?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Generate normal data
from scipy.stats import norm
data = norm.rvs(size=____)

# Plot distribution
plt.hist(____)
plt.show()

# Compute and print true probability for greater than 2
true_prob = 1 - norm.cdf(____)
print(____)

# Compute and print sample probability for greater than 2
sample_prob = sum(obs > ____ for obs in data) / len(____)
print(____)
Code bewerken en uitvoeren