1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v R

Connected

cvičení

Jsou zjištění z vzorku zobecnitelná?

Právě sis ukázal/a, jak příležitostný výběr vzorků—tedy sběr dat nejjednodušší dostupnou metodou—může vést k vzorkům, které nepředstavují celou populaci. Jinými slovy, zjištění z takového vzorku nelze zobecnit na celou populaci. Vizualizace rozdělení populace a vzorku ti pomůže zjistit, zda je vzorek reprezentativní.

Spotify dataset obsahuje sloupec acousticness, což je míra spolehlivosti od nuly do jedné, která udává, zda je skladba akustická—tedy zda vznikla s použitím nepřipojených nástrojů. Podíváš se na hodnoty acousticness v celé populaci skladeb a porovnáš je s vzorkem.

K dispozici máš spotify_population a spotify_mysterious_sample; načteny jsou dplyr a ggplot2.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Pomocí spotify_population vykresli histogram acousticness s binwidth nastaveným na 0.01.