Nichtstandard-Schätzer
In der letzten Übung hast du ein einfaches Bootstrap ausgeführt, das wir nun für komplexere Schätzer anpassen.
Angenommen, du untersuchst die Gesundheit von Studierenden. Du erhältst die Körpergröße und das Gewicht von 1000 Studierenden und interessierst dich für die Median-Körpergröße sowie die Korrelation zwischen Größe und Gewicht und die zugehörigen 95-%-KIs für diese Größen. Lass uns Bootstrapping verwenden.
Sieh dir das pandas-DataFrame df mit den Größen und Gewichten von 1000 Studierenden an. Berechne damit das 95-%-KI sowohl für die Median-Körpergröße als auch für die Korrelation zwischen Größe und Gewicht.
Diese Übung ist Teil des Kurses
Statistische Simulation in Python
Anleitung zur Übung
- Verwende die Methode
.sample()aufdf, um eine Stichprobe der Daten mit Zurücklegen zu erzeugen, und weise sietmp_dfzu. - Berechne für jedes erzeugte Datenset in
tmp_dfdie Median-Größen und die Korrelation zwischen Größe und Gewicht mit.median()bzw..corr(). - Hänge die Median-Größen an
height_mediansund die Korrelationen anhw_corran. - Berechne zum Schluss die 95-%-Konfidenzintervalle (
[2.5, 97.5]) für jede der oben genannten Größen mitnp.percentile().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Sample with replacement and calculate quantities of interest
sims, data_size, height_medians, hw_corr = 1000, df.shape[0], [], []
for i in range(sims):
tmp_df = ____(n=____, replace=____)
height_medians.append(____)
hw_corr.append(____)
# Calculate confidence intervals
height_median_ci = np.____
height_weight_corr_ci = np.____
print("Height Median CI = {} \nHeight Weight Correlation CI = {}".format( height_median_ci, height_weight_corr_ci))