1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v R

Connected

cvičení

Jednoduché vzorkování s dplyr

V průběhu této kapitoly budeš pracovat s daty o skladbách ze Spotify. Každý řádek datasetu představuje jednu skladbu a celkem jich je 41 656. Sloupce obsahují název skladby, interprety, rok vydání a různé vlastnosti jako délku, tempo nebo tanečnost. Začneme délkami skladeb.

Tvým prvním úkolem je vzorkovat dataset skladeb a porovnat výpočet na celé populaci se stejným výpočtem na vzorku.

Dataset spotify_population je k dispozici a balíček dplyr je načtený.

Pokyny 1/2

undefined XP
    1
    2
  • Pomocí View() si prohlédni dataset spotify_population. Prozkoumej ho v prohlížeči, dokud ti nebude jasné, co obsahuje.
  • Pomocí dplyr vyber náhodný vzorek 1 000 řádků z datasetu spotify_population a výsledek ulož do proměnné spotify_sample.