Normalverteilung
Weiter geht’s mit der wohl bekanntesten und nützlichsten Verteilung: der Normal- bzw. Gauß-Verteilung. In den Folien haben wir kurz die glockenförmige Kurve angesprochen und wie uns die Normalverteilung zusammen mit dem zentralen Grenzwertsatz Hypothesentests ermöglicht.
Ähnlich wie in den vorherigen Übungen simulierst du hier zuerst Daten und untersuchst die Verteilung, gehst dann einen Schritt weiter und betrachtest die Wahrscheinlichkeit bestimmter Beobachtungen.
Diese Übung ist Teil des Kurses
Statistik-Interviewfragen in Python üben
Anleitung zur Übung
- Erzeuge die Daten für die Verteilung mit der Funktion
rvs()undsizeauf 1000 gesetzt; weise sie der Variablendatazu. - Zeige ein
matplotlib-Histogramm an; untersuche die Form der Verteilung. - Gegeben eine standardisierte Normalverteilung: Wie groß ist die Wahrscheinlichkeit für eine Beobachtung größer als 2?
- Bezogen auf unser Sample: Wie groß ist die Wahrscheinlichkeit für eine Beobachtung größer als 2?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Generate normal data
from scipy.stats import norm
data = norm.rvs(size=____)
# Plot distribution
plt.hist(____)
plt.show()
# Compute and print true probability for greater than 2
true_prob = 1 - norm.cdf(____)
print(____)
# Compute and print sample probability for greater than 2
sample_prob = sum(obs > ____ for obs in data) / len(____)
print(____)