Normalverteilung
Weiter geht’s mit der wohl bekanntesten und nützlichsten Verteilung: der Normal- bzw. Gauß-Verteilung. In den Folien haben wir kurz die glockenförmige Kurve angesprochen und wie uns die Normalverteilung zusammen mit dem zentralen Grenzwertsatz Hypothesentests ermöglicht.
Ähnlich wie in den vorherigen Übungen simulierst du hier zuerst Daten und untersuchst die Verteilung, gehst dann einen Schritt weiter und betrachtest die Wahrscheinlichkeit bestimmter Beobachtungen.
Diese Übung ist Teil des Kurses
<Kurs>Statistik-Interviewfragen in Python üben</Kurs>Übungsanweisungen
- Erzeuge die Daten für die Verteilung mit der Funktion
rvs()undsizeauf 1000 gesetzt; weise sie der Variablendatazu. - Zeige ein
matplotlib-Histogramm an; untersuche die Form der Verteilung. - Gegeben eine standardisierte Normalverteilung: Wie groß ist die Wahrscheinlichkeit für eine Beobachtung größer als 2?
- Bezogen auf unser Sample: Wie groß ist die Wahrscheinlichkeit für eine Beobachtung größer als 2?
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Generate normal data
from scipy.stats import norm
data = norm.rvs(size=____)
# Plot distribution
plt.hist(____)
plt.show()
# Compute and print true probability for greater than 2
true_prob = 1 - norm.cdf(____)
print(____)
# Compute and print sample probability for greater than 2
sample_prob = sum(obs > ____ for obs in data) / len(____)
print(____)