1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lấy mẫu trong Python

Connected

Bài tập

Lấy mẫu đơn giản với pandas

Xuyên suốt chương này, bạn sẽ khám phá dữ liệu bài hát từ Spotify. Mỗi hàng trong tập dữ liệu quần thể này đại diện cho một bài hát, với hơn 40.000 hàng. Các cột gồm tên bài hát, nghệ sĩ thể hiện, năm phát hành và các thuộc tính như thời lượng, nhịp độ (tempo), và độ dễ nhảy (danceability). Bạn sẽ bắt đầu bằng cách xem xét thời lượng.

Nhiệm vụ đầu tiên của bạn là lấy mẫu từ tập dữ liệu Spotify và so sánh thời lượng trung bình của quần thể với mẫu.

spotify_population đã có sẵn và pandas đã được nạp với bí danh pd.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Lấy mẫu 1000 hàng từ spotify_population, gán vào spotify_sample.