1. Apprendre
  2. /
  3. Cours
  4. /
  5. Échantillonnage en Python

Connected

Exercice

Distribution d'échantillonnage vs distribution bootstrap

La distribution d'échantillonnage et la distribution bootstrap sont étroitement liées. Dans les rares situations où vous pouvez prélever à répétition des échantillons d'une population, il est utile de générer l'une après l'autre la distribution d'échantillonnage et la distribution bootstrap pour voir comment elles se comparent.

Ici, la statistique qui vous intéresse est la moyenne du score de popularity des chansons.

spotify_population (l'ensemble complet des données) et spotify_sample (500 lignes échantillonnées aléatoirement à partir de spotify_population) sont fournis; pandas et numpy sont importés avec leurs alias habituels.

Instructions 1/2

undefined XP
  • 1
    • Générez une distribution d'échantillonnage de 2000 réplicats à l'aide d'une boucle for.
    • Échantillonnez 500 lignes de la population sans remise et calculez la moyenne de popularity.
  • 2
    • Échantillonnez 500 lignes de l'échantillon avec remise et calculez la moyenne de popularity pour générer une distribution bootstrap de 2000 réplicats.