LoslegenKostenlos loslegen

Nichtstandard-Schätzer

In der letzten Übung hast du ein einfaches Bootstrap ausgeführt, das wir nun für komplexere Schätzer anpassen.

Angenommen, du untersuchst die Gesundheit von Studierenden. Du erhältst die Körpergröße und das Gewicht von 1000 Studierenden und interessierst dich für die Median-Körpergröße sowie die Korrelation zwischen Größe und Gewicht und die zugehörigen 95-%-KIs für diese Größen. Lass uns Bootstrapping verwenden.

Sieh dir das pandas-DataFrame df mit den Größen und Gewichten von 1000 Studierenden an. Berechne damit das 95-%-KI sowohl für die Median-Körpergröße als auch für die Korrelation zwischen Größe und Gewicht.

Diese Übung ist Teil des Kurses

Statistische Simulation in Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Methode .sample() auf df, um eine Stichprobe der Daten mit Zurücklegen zu erzeugen, und weise sie tmp_df zu.
  • Berechne für jedes erzeugte Datenset in tmp_df die Median-Größen und die Korrelation zwischen Größe und Gewicht mit .median() bzw. .corr().
  • Hänge die Median-Größen an height_medians und die Korrelationen an hw_corr an.
  • Berechne zum Schluss die 95-%-Konfidenzintervalle ([2.5, 97.5]) für jede der oben genannten Größen mit np.percentile().

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Sample with replacement and calculate quantities of interest
sims, data_size, height_medians, hw_corr = 1000, df.shape[0], [], []
for i in range(sims):
    tmp_df = ____(n=____, replace=____)
    height_medians.append(____)
    hw_corr.append(____)

# Calculate confidence intervals
height_median_ci = np.____
height_weight_corr_ci = np.____
print("Height Median CI = {} \nHeight Weight Correlation CI = {}".format( height_median_ci, height_weight_corr_ci))
Code bearbeiten und ausführen