1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lấy mẫu trong R

Connected

Bài tập

Lấy mẫu đơn giản với dplyr

Trong suốt chương này bạn sẽ khám phá dữ liệu bài hát từ Spotify. Mỗi hàng trong bộ dữ liệu đại diện cho một bài hát, và có 41656 hàng. Các cột bao gồm tên bài hát, nghệ sĩ thể hiện, năm phát hành, và các thuộc tính của bài hát như thời lượng, tempo, và độ dễ nhảy (danceability). Chúng ta sẽ bắt đầu bằng cách xem các thời lượng.

Nhiệm vụ đầu tiên của bạn là lấy mẫu từ bộ dữ liệu bài hát và so sánh một phép tính trên toàn bộ quần thể và trên một mẫu.

spotify_population đã được cung cấp và dplyr đã được nạp.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Dùng View() để xem bộ dữ liệu spotify_population. Khám phá trong trình xem cho đến khi bạn nắm rõ nội dung của nó.
  • Dùng dplyr để lấy mẫu 1000 hàng từ spotify_population, gán vào spotify_sample.