Normale steekproefverdelingen
Je wilt een realistisch gemiddeld slotkoersniveau voor de S&P 500 schatten over een deel van de handelsgeschiedenis. Dit lijkt een logische toepassing van een betrouwbaarheidsinterval, omdat je een steekproefstatistiek hebt en die wilt gebruiken om een populatiestatistiek te schatten. Je eerste stap is echter controleren of de steekproefverdeling ongeveer normaal is. In deze oefening doe je precies dat. In de volgende oefening gebruik je dit resultaat om je betrouwbaarheidsinterval te maken.
Dezelfde gegevens btc_sp_df zijn voor je geladen, net als de pakketten pandas als pd, NumPy als np en Matplotlib als plt.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in Python
Oefeninstructies
- Definieer een variabele
num_samplesals het gewenste aantal steekproeven (200), en definieer een lege lijstsample_meansom het gemiddelde van elk van de 200 steekproeven in op te slaan. - Schrijf een
for-lus die het steekproefprocesnum_sampleskeer herhaalt. - Selecteer willekeurig 500 S&P500-slotkoersen uit de kolom
Close_SP500vanbtc_sp_df. - Bereken het gemiddelde van elk van deze steekproeven en sla ze op in
sample_means.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define the number of samples to take and store the sample means
num_samples = ____
sample_means = ____
# Write a for loop which repeats the sampling num_samples times
for i in ____:
# Select 500 random Close_SP500 prices
sp500_sample = np.___(____, size=____)
# Compute mean closing price and save it to sample_means
____.append(____.mean())
plt.hist(sample_means)
plt.show()