Normale Stichprobenverteilungen
Du möchtest einen realistischen durchschnittlichen Schlusskurs für den S&P 500 über einen Teil seiner Handelshistorie schätzen. Das ist ein naheliegender Anwendungsfall für ein Konfidenzintervall, denn du hast eine Stichprobenkennzahl und willst damit eine Populationskennzahl schätzen. Dein erster Schritt sollte jedoch sein zu prüfen, ob die Stichprobenverteilung ungefähr normal ist. In dieser Übung machst du genau das. In der nächsten Übung nutzt du dieses Ergebnis, um dein Konfidenzintervall zu erstellen.
Die gleichen Daten btc_sp_df wurden für dich geladen, ebenso die Pakete pandas als pd, NumPy als np und Matplotlib als plt.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in Python
Anleitung zur Übung
- Definiere eine Variable
num_samplesals gewünschte Anzahl an Stichproben (200) und eine leere Listesample_means, um den Mittelwert jeder der 200 Stichproben zu speichern. - Schreibe eine
for-Schleife, die den Stichprobenprozessnum_samples-mal wiederholt. - Wähle 500 zufällige Schlusskurse des S&P 500 aus der Spalte
Close_SP500vonbtc_sp_dfaus. - Berechne den Mittelwert jeder dieser Stichproben und speichere ihn in
sample_means.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the number of samples to take and store the sample means
num_samples = ____
sample_means = ____
# Write a for loop which repeats the sampling num_samples times
for i in ____:
# Select 500 random Close_SP500 prices
sp500_sample = np.___(____, size=____)
# Compute mean closing price and save it to sample_means
____.append(____.mean())
plt.hist(sample_means)
plt.show()