Sampling sederhana dengan dplyr
Sepanjang bab ini Anda akan mengeksplorasi data lagu dari Spotify. Setiap baris himpunan data mewakili sebuah lagu, dan terdapat 41656 baris. Kolom-kolomnya mencakup nama lagu, artis yang membawakannya, tahun rilis, serta atribut lagu seperti durasi, tempo, dan danceability. Kita akan mulai dengan melihat durasinya.
Tugas pertama Anda adalah mengambil sampel dari himpunan data lagu dan membandingkan suatu perhitungan pada seluruh populasi dan pada sebuah sampel.
spotify_population tersedia dan dplyr sudah dimuat.
Latihan ini adalah bagian dari kursus
Sampling di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# View the whole population dataset
___
# Sample 1000 rows from spotify_population
spotify_sample <- ___
# See the result
spotify_sample