MulaiMulai sekarang secara gratis

Sampling sederhana dengan dplyr

Sepanjang bab ini Anda akan mengeksplorasi data lagu dari Spotify. Setiap baris himpunan data mewakili sebuah lagu, dan terdapat 41656 baris. Kolom-kolomnya mencakup nama lagu, artis yang membawakannya, tahun rilis, serta atribut lagu seperti durasi, tempo, dan danceability. Kita akan mulai dengan melihat durasinya.

Tugas pertama Anda adalah mengambil sampel dari himpunan data lagu dan membandingkan suatu perhitungan pada seluruh populasi dan pada sebuah sampel.

spotify_population tersedia dan dplyr sudah dimuat.

Latihan ini adalah bagian dari kursus

Sampling di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# View the whole population dataset
___

# Sample 1000 rows from spotify_population
spotify_sample <- ___


# See the result
spotify_sample
Edit dan Jalankan Kode