1. Nauka
  2. /
  3. Kursy
  4. /
  5. Próbkowanie w Pythonie

Connected

ćwiczenie

Rozkład próbkowania a rozkład bootstrapowy

Rozkład próbkowania i rozkład bootstrapowy są ze sobą ściśle powiązane. W sytuacjach, gdy można wielokrotnie pobierać próbki z populacji (co zdarza się rzadko), warto wygenerować oba rozkłady jeden po drugim, aby zobaczyć, jak się do siebie odnoszą.

Statystyką, która cię interesuje, jest średni wynik popularity piosenek.

Dostępne są: spotify_population (cały zbiór danych) oraz spotify_sample (500 losowo wybranych wierszy z spotify_population); biblioteki pandas i numpy są załadowane pod swoimi standardowymi aliasami.

Instrukcje 1/2

undefined XP
  • 1
    • Użyj pętli for, aby wygenerować rozkład próbkowania złożony z 2000 replikacji.
    • Pobierz 500 wierszy z populacji bez zwracania i oblicz średnią wartość popularity.
  • 2
    • Pobierz 500 wierszy z próbki ze zwracaniem i oblicz średnią wartość popularity, aby wygenerować rozkład bootstrapowy złożony z 2000 replikacji.