1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v Pythonu

Connected

Cvičení

Jednoduché vzorkování s pandas

V průběhu této kapitoly budeš prozkoumávat data o skladbách ze Spotify. Každý řádek tohoto populačního datasetu představuje jednu skladbu a celkem jich je přes 40 000. Sloupce obsahují název skladby, interprety, rok vydání a různé atributy, jako je délka, tempo nebo tanečnost. Začneme délkami skladeb.

Tvým prvním úkolem je vzorkovat dataset Spotify a porovnat průměrnou délku skladby v celé populaci se vzorkem.

K dispozici máš spotify_population a pandas je načtený jako pd.

Pokyny 1/2

undefined XP
    1
    2
  • Vyber náhodný vzorek 1000 řádků z spotify_population a přiřaď ho do proměnné spotify_sample.