Bootstrap-Stichproben visualisieren
In dieser Übung erzeugst du Bootstrap-Stichproben aus den jährlichen Niederschlagsdaten der Sheffield Weather Station im Vereinigten Königreich von 1883 bis 2015. Die Daten liegen in der NumPy-Array rainfall in Millimetern (mm) vor. Durch die grafische Darstellung der Bootstrap-Stichproben mit einer ECDF bekommst du ein Gefühl dafür, wie Bootstrap-Sampling probabilistische Beschreibungen von Daten ermöglicht.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 2)
Anleitung zur Übung
- Schreibe eine
for-Schleife, um50Bootstrap-Stichproben der Niederschlagsdaten zu erzeugen und ihre ECDF zu plotten.- Verwende
np.random.choice(), um eine Bootstrap-Stichprobe aus dem NumPy-Arrayrainfallzu erzeugen. Achte darauf, dass diesizedes resampleten Arrayslen(rainfall)ist. - Verwende die Funktion
ecdf(), die du im Vorgängerkurs geschrieben hast, um diex- undy-Werte für die ECDF der Bootstrap-Stichprobebs_samplezu erzeugen. - Plotte die ECDF-Werte. Gib zusätzlich zu den Keyword-Argumenten
marker='.'undlinestyle='none'auchcolor='gray'(für graue Punkte) undalpha=0.1(für halbtransparente Punkte, da wir so viele überlagern) an.
- Verwende
- Verwende
ecdf(), umx- undy-Werte für die ECDF der ursprünglichen Niederschlagsdaten im Arrayrainfallzu erzeugen. - Plotte die ECDF-Werte der Originaldaten.
- Klicke auf Antwort senden, um die Stichproben zu visualisieren!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
for _ in range(50):
# Generate bootstrap sample: bs_sample
bs_sample = ____(____, size=____)
# Compute and plot ECDF from bootstrap sample
x, y = ____
_ = plt.plot(____, ____, ____='.', ____='none',
____='gray', ____=0.1)
# Compute and plot ECDF from original data
x, y = ____
_ = plt.plot(____, ____, ____='.')
# Make margins and label axes
plt.margins(0.02)
_ = plt.xlabel('yearly rainfall (mm)')
_ = plt.ylabel('ECDF')
# Show the plot
plt.show()