Problem der multiplen Vergleiche

Das Problem der multiplen Vergleiche tritt auf, wenn Forschende wiederholt verschiedene Variablen/Stichproben miteinander auf Signifikanz prüfen. Durch reinen Zufall erwarten wir gelegentlich ein statistisch signifikantes Ergebnis zu finden.

In dieser Übung arbeitest du mit Gehaltsdaten von Beschäftigten der Stadt Austin, TX. Du vergleichst deren Gehälter mit zufällig generierten Daten. So siehst du, wie oft diese Zufallsdaten „signifikant“ darin sind, die Gehälter der Beschäftigten zu erklären. Offensichtlich wäre eine solche „Signifikanz“ nur scheinbar, denn Zufallszahlen helfen nicht wirklich, etwas zu erklären!

Ein DataFrame mit Gehältern von Polizeikräften (police_salaries_df) wurde für dich geladen, ebenso die Pakete pandas als pd, NumPy als np, Matplotlib als plt und stats aus SciPy.

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in Python</Kurs>

Übungsanweisungen

Speichere die Anzahl der Personen im Datensatz in n_rows (jede Zeile entspricht einer Person) und initialisiere die Anzahl signifikanter Ergebnisse, n_significant, mit null.
Schreibe eine for-Schleife, die 1000-mal läuft und n_rows Zufallszahlen erzeugt.
Berechne Pearsons R und den zugehörigen p-Wert zwischen diesen zufällig generierten Zahlen und den Gehältern der Polizeikräfte.
Wenn der p-Wert auf dem 5-%-Niveau signifikant ist, erhöhe n_significant um eins mit dem Operator +=.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Compute number of rows and initialize n_significant
n_rows = ____
n_significant = ____

# For loop which generates n_rows random numbers 1000 times
for i in ____:
  random_nums = np.random.uniform(size=____)
  # Compute correlation between random_nums and police salaries
  r, p_value = stats.____(____, random_nums)
  # If the p-value is significant at 5%, increment n_significant
  if ____ < ____:
    ____ += 1
    
print(n_significant)

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in Python</Kurs>

Hohe SchwierigkeitSchwierigkeitsgrad

4.9+

Kurs kostenlos starten

In diesem Kapitel untersuchen wir die Beziehung zwischen Stichproben und statistisch begründbaren Schlussfolgerungen. Die Wahl der Stichprobe ist die Grundlage für solide statistische Entscheidungen, und wir zeigen, wie sich die Auswahl einer Stichprobe auf das Ergebnis deiner Inferenz auswirkt.

Exercise 1: Statistische Inferenz und Zufallsstichprobe Exercise 2: Stichproben und Punktschätzer Exercise 3: Wiederholtes Sampling, Punktschätzungen und Inferenz Exercise 4: Stichproben und Bias Exercise 5: Stichproben visualisieren Exercise 6: Inferenz und Verzerrung Exercise 7: Konfidenzintervalle und Stichproben Exercise 8: Normale Stichprobenverteilungen Exercise 9: Konfidenzintervalle berechnen Exercise 10: Schlussfolgerungen aus Stichproben ziehen

Lerne, wie du Tests auf Normalverteilung, Korrelation sowie parametrische und nichtparametrische Tests für belastbare Inferenz anwendest. Hypothesentests sind Werkzeuge, und das richtige Werkzeug für die Aufgabe zu wählen, ist entscheidend für statistische Entscheidungen. Auch wenn dir einige dieser Tests aus Einsteigerkursen bekannt sind, gehst du hier tiefer, um deinen Inferenz-Werkzeugkasten zu erweitern.

Exercise 1: Normalitätstests Exercise 2: Auf Normalverteilung testen Exercise 3: Verteilung der Fehler Exercise 4: Anpassen einer Normalverteilung Exercise 5: Korrelationstests Exercise 6: Auf Korrelation testen Exercise 7: Autokorrelation Exercise 8: Erklärte Varianz Exercise 9: Parametrische Tests Exercise 10: Gleiche Varianz Exercise 11: Normalität von Gruppen Exercise 12: ANOVA Exercise 13: Nichtparametrische Tests Exercise 14: Ranglisten vergleichen Exercise 15: Medianwerte vergleichen

In diesem Kapitel misst und interpretierst du Effektstärken in verschiedenen Situationen, begegnest dem Problem der multiplen Vergleiche und untersuchst die Teststärke (Power) im Detail. Während p-Werte dir sagen, ob ein signifikanter Effekt vorliegt, verraten sie nicht, wie stark dieser ist. Die Effektstärke misst, wie stark die Wirkung einer Behandlung ausfällt. Meistere in diesem Kapitel die Faktoren, die der Effektstärke zugrunde liegen.

Exercise 1: Effektstärke Exercise 2: Effektstärke für Mittelwerte Exercise 3: Effektstärke für Korrelationen Exercise 4: Effektstärke für kategoriale Variablen Exercise 5: Mehrfachvergleiche und Korrekturen Exercise 6: Problem der multiplen Vergleiche

Aktuelle Übung

Exercise 7: Bonferroni-Holm-Korrektur Exercise 8: Teststärke Exercise 9: Was ist eigentlich Power?Exercise 10: Power für Versuchsplanung Exercise 11: Power und Stichprobengrößen berechnen

Du erweiterst deinen Werkzeugkasten der Inferenzstatistik weiter mit einem Blick auf Bootstrapping, Permutationstests und Methoden zum Kombinieren von Evidenz aus p-Werten. Bootstrapping bietet dir einen ersten Einblick in statistische Simulation. In der Lektion zur Metaanalyse lernst du, wie du Ergebnisse aus mehreren Studien zusammenführst. Zum Abschluss schaust du dir Permutationstests an – ein leistungsfähiges und flexibles nichtparametrisches statistisches Werkzeug.

Exercise 1: Bootstrapping Exercise 2: Bootstrap-Konfidenzintervalle Exercise 3: Bootstrapping vs. Normalverteilung Exercise 4: Evidenz aus p-Werten kombinieren Exercise 5: Fishers Methode in SciPy Exercise 6: Schlussfolgern mit Fishers Methode Exercise 7: Fishers Methode zusammenfassen Exercise 8: Permutationstests Exercise 9: Permutationstests für Korrelationen Exercise 10: Permutationstests und Bootstrapping Exercise 11: Schiefe Daten mit einem Permutationstest analysieren Exercise 12: Abschließendes Kursvideo