Jednoduché vzorkování s pandas

V průběhu této kapitoly budeš prozkoumávat data o skladbách ze Spotify. Každý řádek tohoto populačního datasetu představuje jednu skladbu a celkem jich je přes 40 000. Sloupce obsahují název skladby, interprety, rok vydání a různé atributy, jako je délka, tempo nebo tanečnost. Začneme délkami skladeb.

Tvým prvním úkolem je vzorkovat dataset Spotify a porovnat průměrnou délku skladby v celé populaci se vzorkem.

K dispozici máš spotify_population a pandas je načtený jako pd.

Toto cvičení je součástí kurzu

Vzorkování v Pythonu

Zobrazit kurz

Interaktivní cvičení na vyzkoušení si v praxi

Vyzkoušejte si toto cvičení dokončením tohoto ukázkového kódu.

# Sample 1000 rows from spotify_population
spotify_sample = ____

# Print the sample
print(spotify_sample)

Upravit a spustit kód