1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v R

Connected

cvičení

Výběrové rozdělení vs. bootstrapové rozdělení

Výběrové rozdělení a bootstrapové rozdělení spolu úzce souvisí. V situacích, kdy můžeš opakovaně vzorkovat z populace (což bývá vzácné), je užitečné vygenerovat obě rozdělení – nejprve výběrové, pak bootstrapové – a pozorovat, jak spolu souvisí.

Statistika, která nás zajímá, je průměrné skóre popularity skladeb.

K dispozici máš spotify_population (celý dataset) a spotify_sample (500 řádků reprezentujících původní vzorek); načten je balíček dplyr.

Instrukce 1/2

undefined XP
  • 1
    • Vygeneruj výběrové rozdělení z 2000 replikátů.
    • Z populace náhodně vyber 500 řádků bez nahrazení.
    • Vypočítej sledovanou statistiku (průměr popularity) do sloupce mean_popularity.
    • Extrahuj statistiku jako jednu číselnou hodnotu (ne tibble).
  • 2
    • Vygeneruj bootstrapové rozdělení z 2000 replikátů.
    • Z vzorku náhodně vyber 500 řádků s nahrazením.
    • Vypočítej sledovanou statistiku (průměr popularity) do sloupce mean_popularity.
    • Extrahuj statistiku jako jednu číselnou hodnotu (ne tibble).