1. Nauka
  2. /
  3. Kursy
  4. /
  5. Próbkowanie w Pythonie

Connected

ćwiczenie

Czy wyniki z próbki można uogólnić?

Właśnie zobaczyłeś, jak próbkowanie wygodne—czyli zbieranie danych najłatwiejszą dostępną metodą—może prowadzić do próbek niereprezentatywnych dla całej populacji. Oznacza to, że wyników uzyskanych z takiej próbki nie można uogólniać na całą populację. Porównanie rozkładów populacji i próbki pomaga ocenić, czy próbka rzeczywiście ją reprezentuje.

Zbiór danych Spotify zawiera kolumnę acousticness, która wyraża stopień pewności (od zera do jednego) co do tego, czy utwór został nagrany z użyciem instrumentów akustycznych. Porównasz rozkład acousticness dla całej populacji utworów z rozkładem dla wybranej próbki.

Dostępne są spotify_population i spotify_mysterious_sample; załadowane są też pandas jako pd, matplotlib.pyplot jako plt i numpy jako np.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Narysuj histogram wartości acousticness z spotify_population, używając pandas .hist() z przedziałami o szerokości 0.01 w zakresie od 0 do 1.