1. Apprendre
  2. /
  3. Cours
  4. /
  5. Échantillonnage en Python

Connected

Exercice

Générer une distribution bootstrap

Le processus pour générer une distribution bootstrap ressemble à celui d'une distribution d'échantillonnage; seul le premier geste diffère.

Pour créer une distribution d'échantillonnage, vous partez de la population et vous échantillonnez sans remise. Pour créer une distribution bootstrap, vous partez d'un échantillon et vous rééchantillonnez avec remise. Ensuite, les étapes sont les mêmes : calculez la statistique sommaire qui vous intéresse sur cet échantillon/rééchantillon, puis répétez le processus plusieurs fois. Dans les deux cas, vous pouvez visualiser la distribution avec un histogramme.

Ici, spotify_sample est un sous-ensemble de l'ensemble de données spotify_population. Pour faciliter la compréhension du rééchantillonnage, une colonne d'index de lignes appelée 'index' a été ajoutée, et seules le nom de l'artiste, le nom de la chanson et la colonne danceability ont été conservés.

spotify_sample est disponible; pandas, numpy et matplotlib.pyplot sont chargés avec leurs alias habituels.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Générez un seul rééchantillon bootstrap à partir de spotify_sample.