1. Apprendre
  2. /
  3. Cours
  4. /
  5. Échantillonnage en Python

Connected

Exercice

Les résultats de l'échantillon sont-ils généralisables?

Vous venez de voir comment l'échantillonnage de convenance — recueillir des données de la façon la plus simple — peut produire des échantillons qui ne sont pas représentatifs de la population. En conséquence, les résultats obtenus à partir de l'échantillon ne sont pas généralisables à l'ensemble de la population. Visualiser les distributions de la population et de l'échantillon peut aider à déterminer si l'échantillon est représentatif ou non de la population.

Le jeu de données Spotify contient une colonne acousticness, qui est une mesure de confiance de zéro à un indiquant si la piste a été produite avec des instruments non branchés. Vous comparerez la distribution de acousticness de la population totale des chansons à celle d'un échantillon de ces chansons.

spotify_population et spotify_mysterious_sample sont disponibles; pandas sous pd, matplotlib.pyplot sous plt et numpy sous np sont chargés.

Instructions 1/3

undefined XP
    1
    2
    3
  • Tracez un histogramme de acousticness à partir de spotify_population avec des classes de largeur 0.01 de 0 à 1 en utilisant .hist() de pandas.