1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lấy mẫu trong Python

Connected

Bài tập

Các phát hiện từ mẫu có khái quát hóa được không?

Bạn vừa thấy cách lấy mẫu thuận tiện — thu thập dữ liệu bằng phương pháp dễ nhất — có thể tạo ra các mẫu không đại diện cho tổng thể. Nói cách khác, điều này có nghĩa là các phát hiện từ mẫu không thể khái quát hóa cho toàn bộ tổng thể. Việc trực quan hóa phân phối của tổng thể và của mẫu có thể giúp xác định xem mẫu có đại diện cho tổng thể hay không.

Bộ dữ liệu Spotify có cột acousticness, là một thước đo độ tin cậy từ 0 đến 1 về việc bản nhạc có được tạo ra bằng nhạc cụ không cắm điện hay không. Bạn sẽ so sánh phân phối acousticness của toàn bộ tổng thể các bài hát với một mẫu trong số đó.

spotify_population và spotify_mysterious_sample đã có sẵn; pandas là pd, matplotlib.pyplot là plt, và numpy là np đã được nạp.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Vẽ biểu đồ histogram của acousticness từ spotify_population với độ rộng bin 0.01 từ 0 đến 1 bằng pandas .hist().