1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v Pythonu

Connected

cvičení

Jsou výsledky ze vzorku zobecnitelné?

Právě jsi viděl/a, jak convenience sampling—tedy sběr dat nejjednodušší dostupnou metodou—může vést k vzorkům, které nejsou reprezentativní pro celou populaci. Jinými slovy, výsledky získané z takového vzorku nelze zobecnit na celou populaci. Porovnání rozdělení populace a vzorku pomocí vizualizace ti pomůže zjistit, zda je vzorek skutečně reprezentativní.

Spotify dataset obsahuje sloupec acousticness, který udává míru spolehlivosti od nuly do jedné pro to, zda byla skladba nahrána s akustickými (nezapojenými) nástroji. Porovnáš rozdělení hodnot acousticness v celé populaci skladeb s hodnotami v náhodném vzorku.

K dispozici máš spotify_population a spotify_mysterious_sample; načteny jsou také pandas jako pd, matplotlib.pyplot jako plt a numpy jako np.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Vykresli histogram hodnot acousticness z datasetu spotify_population se šířkou košů 0.01 v rozsahu od 0 do 1 pomocí pandas .hist().