CommencerCommencer gratuitement

Intervalles de confiance par bootstrap

Vous avez vu précédemment qu’il existe un certain degré de corrélation entre le S&P 500 et le Bitcoin. Une façon de le mesurer consiste à examiner le coefficient de corrélation R de Pearson entre les deux. Cependant, cela ne donne qu’une estimation ponctuelle. On peut supposer qu’à certains moments la corrélation entre les deux est assez forte, tandis qu’à d’autres, ils évoluent très différemment. Comment caractériser cette variabilité ? Une approche consiste à créer un intervalle de confiance par bootstrap pour le coefficient de corrélation entre les deux. C’est précisément ce que vous allez faire maintenant !

Un DataFrame des prix du S&P 500 et du Bitcoin (btc_sp_df) a été chargé pour vous, ainsi que les packages pandas sous pd, NumPy sous np, et stats de SciPy.

Cet exercice fait partie du cours

Fondements de l’inférence en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the daily percent change of each asset
btc_sp_df['Pct_Daily_Change_BTC'] = (____['Open_BTC'] - ____['Close_BTC']) / ____['Open_BTC']
btc_sp_df['Pct_Daily_Change_SP500'] = ____

# Write a function which returns the correlation coefficient
def pearson_r(x, y):
    return stats.____[0]
  
# Compute a bootstrap confidence interval
ci = stats.bootstrap((____, ____), 
                     statistic=____, 
                     vectorized=False, paired=True, n_resamples=1000, random_state=1)

print(ci.confidence_interval)
Modifier et exécuter le code