1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v Pythonu

Connected

cvičení

Generování bootstrap distribuce

Postup pro generování bootstrap distribuce je podobný postupu pro generování výběrového rozdělení – liší se pouze první krok.

Pro vytvoření výběrového rozdělení vycházíš z populace a vzorkuješ bez opakování. Pro vytvoření bootstrap distribuce vycházíš z výběru a vzorkuješ ho s opakováním. Dál jsou kroky stejné: spočítáš souhrnnou statistiku, která tě zajímá, pro daný výběr nebo resample, a celý proces mnohokrát zopakovíš. V obou případech můžeš distribuci vizualizovat pomocí histogramu.

Zde je spotify_sample podmnožina datasetu spotify_population. Aby bylo snadnější pochopit, jak resampling funguje, byl přidán sloupec s indexem řádků nazvaný 'index' a zahrnuty byly pouze sloupce s názvem interpreta, názvem skladby a hodnotou danceability.

spotify_sample je k dispozici; pandas, numpy a matplotlib.pyplot jsou načteny pod svými obvyklými aliasy.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vygeneruj jeden bootstrap resample z spotify_sample.