Intervalles de confiance par bootstrap
Vous avez vu précédemment qu’il existe un certain degré de corrélation entre le S&P 500 et le Bitcoin. Une façon de le mesurer consiste à examiner le coefficient de corrélation R de Pearson entre les deux. Cependant, cela ne donne qu’une estimation ponctuelle. On peut supposer qu’à certains moments la corrélation entre les deux est assez forte, tandis qu’à d’autres, ils évoluent très différemment. Comment caractériser cette variabilité ? Une approche consiste à créer un intervalle de confiance par bootstrap pour le coefficient de corrélation entre les deux. C’est précisément ce que vous allez faire maintenant !
Un DataFrame des prix du S&P 500 et du Bitcoin (btc_sp_df) a été chargé pour vous, ainsi que les packages pandas sous pd, NumPy sous np, et stats de SciPy.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the daily percent change of each asset
btc_sp_df['Pct_Daily_Change_BTC'] = (____['Open_BTC'] - ____['Close_BTC']) / ____['Open_BTC']
btc_sp_df['Pct_Daily_Change_SP500'] = ____
# Write a function which returns the correlation coefficient
def pearson_r(x, y):
return stats.____[0]
# Compute a bootstrap confidence interval
ci = stats.bootstrap((____, ____),
statistic=____,
vectorized=False, paired=True, n_resamples=1000, random_state=1)
print(ci.confidence_interval)