Verteilung der Fehler

Kaum ein realer Prozess lässt sich perfekt vorhersagen. Wünschenswert ist, dass die Fehler normalverteilt sind. Das bedeutet, dass einige tatsächliche Werte über deiner Vorhersage liegen und andere darunter. Die Fehler (also die Differenz zwischen tatsächlichen Werten und Vorhersagen) „schweben“ dann zufällig um null.

In dieser Übung analysierst du die Ergebnisse eines vorgefertigten linearen Modells, das das Gehalt von Polizistinnen und Polizisten vorhersagt. Anschließend betrachtest du die Fehler und prüfst, ob sie näherungsweise normalverteilt sind. Die Vorhersagen sind als Liste in preds gespeichert, die tatsächlichen Gehälter als Liste in salaries.

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in Python</Kurs>

Übungsanweisungen

Berechne den Fehler als tatsächliche Gehälter minus vorhergesagte Gehälter.
Stelle die Fehler in einem Histogramm dar.
Führe einen Anderson-Darling-Test auf Normalverteilung für die Fehler durch.
Finde und gib die significance_level(s) aus, bei denen die Nullhypothese zurückgewiesen würde.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Compute the error as actual minus predicted salary
error = ____

# Plot the errors as a histogram
plt.____(____)
plt.show()

# Conduct an Anderson-Darling test using the years of experience
result = ____(____)

# Find where the result is significant
print(result.____[result.____ > result.____])

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in Python</Kurs>

Hohe SchwierigkeitSchwierigkeitsgrad

4.9+

Kurs kostenlos starten

In diesem Kapitel untersuchen wir die Beziehung zwischen Stichproben und statistisch begründbaren Schlussfolgerungen. Die Wahl der Stichprobe ist die Grundlage für solide statistische Entscheidungen, und wir zeigen, wie sich die Auswahl einer Stichprobe auf das Ergebnis deiner Inferenz auswirkt.

Exercise 1: Statistische Inferenz und Zufallsstichprobe Exercise 2: Stichproben und Punktschätzer Exercise 3: Wiederholtes Sampling, Punktschätzungen und Inferenz Exercise 4: Stichproben und Bias Exercise 5: Stichproben visualisieren Exercise 6: Inferenz und Verzerrung Exercise 7: Konfidenzintervalle und Stichproben Exercise 8: Normale Stichprobenverteilungen Exercise 9: Konfidenzintervalle berechnen Exercise 10: Schlussfolgerungen aus Stichproben ziehen

Lerne, wie du Tests auf Normalverteilung, Korrelation sowie parametrische und nichtparametrische Tests für belastbare Inferenz anwendest. Hypothesentests sind Werkzeuge, und das richtige Werkzeug für die Aufgabe zu wählen, ist entscheidend für statistische Entscheidungen. Auch wenn dir einige dieser Tests aus Einsteigerkursen bekannt sind, gehst du hier tiefer, um deinen Inferenz-Werkzeugkasten zu erweitern.

Exercise 1: Normalitätstests Exercise 2: Auf Normalverteilung testen Exercise 3: Verteilung der Fehler

Aktuelle Übung

Exercise 4: Anpassen einer Normalverteilung Exercise 5: Korrelationstests Exercise 6: Auf Korrelation testen Exercise 7: Autokorrelation Exercise 8: Erklärte Varianz Exercise 9: Parametrische Tests Exercise 10: Gleiche Varianz Exercise 11: Normalität von Gruppen Exercise 12: ANOVA Exercise 13: Nichtparametrische Tests Exercise 14: Ranglisten vergleichen Exercise 15: Medianwerte vergleichen

In diesem Kapitel misst und interpretierst du Effektstärken in verschiedenen Situationen, begegnest dem Problem der multiplen Vergleiche und untersuchst die Teststärke (Power) im Detail. Während p-Werte dir sagen, ob ein signifikanter Effekt vorliegt, verraten sie nicht, wie stark dieser ist. Die Effektstärke misst, wie stark die Wirkung einer Behandlung ausfällt. Meistere in diesem Kapitel die Faktoren, die der Effektstärke zugrunde liegen.

Exercise 1: Effektstärke Exercise 2: Effektstärke für Mittelwerte Exercise 3: Effektstärke für Korrelationen Exercise 4: Effektstärke für kategoriale Variablen Exercise 5: Mehrfachvergleiche und Korrekturen Exercise 6: Problem der multiplen Vergleiche Exercise 7: Bonferroni-Holm-Korrektur Exercise 8: Teststärke Exercise 9: Was ist eigentlich Power?Exercise 10: Power für Versuchsplanung Exercise 11: Power und Stichprobengrößen berechnen

Du erweiterst deinen Werkzeugkasten der Inferenzstatistik weiter mit einem Blick auf Bootstrapping, Permutationstests und Methoden zum Kombinieren von Evidenz aus p-Werten. Bootstrapping bietet dir einen ersten Einblick in statistische Simulation. In der Lektion zur Metaanalyse lernst du, wie du Ergebnisse aus mehreren Studien zusammenführst. Zum Abschluss schaust du dir Permutationstests an – ein leistungsfähiges und flexibles nichtparametrisches statistisches Werkzeug.

Exercise 1: Bootstrapping Exercise 2: Bootstrap-Konfidenzintervalle Exercise 3: Bootstrapping vs. Normalverteilung Exercise 4: Evidenz aus p-Werten kombinieren Exercise 5: Fishers Methode in SciPy Exercise 6: Schlussfolgern mit Fishers Methode Exercise 7: Fishers Methode zusammenfassen Exercise 8: Permutationstests Exercise 9: Permutationstests für Korrelationen Exercise 10: Permutationstests und Bootstrapping Exercise 11: Schiefe Daten mit einem Permutationstest analysieren Exercise 12: Abschließendes Kursvideo