1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v Pythonu

Connected

cvičení

Rozdíl mezi výběrovým a bootstrapovým rozdělením

Výběrové rozdělení a bootstrapové rozdělení spolu úzce souvisí. V situacích, kdy můžeš opakovaně vzorkovat z populace (takové příležitosti jsou vzácné), je užitečné vygenerovat obě rozdělení za sebou a sledovat, jak spolu souvisí.

Statistika, která tě zde zajímá, je průměrné skóre popularity skladeb.

K dispozici máš spotify_population (celý dataset) a spotify_sample (500 náhodně vybraných řádků z spotify_population); pandas a numpy jsou načteny pod svými obvyklými aliasy.

Instrukce 1/2

undefined XP
  • 1
    • Pomocí smyčky for vygeneruj výběrové rozdělení s 2000 replikáty.
    • Z populace náhodně vyber 500 řádků bez opakování a vypočítej průměrnou hodnotu popularity.
  • 2
    • Z vzorku náhodně vyber 500 řádků s opakováním a vypočítej průměrnou hodnotu popularity, čímž vygeneruješ bootstrapové rozdělení s 2000 replikáty.