1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Thống kê với Python

Connected

Bài tập

Trung bình của các giá trị trung bình

Bạn muốn biết số người dùng trung bình (num_users) trên mỗi thương vụ là bao nhiêu, và bạn muốn biết con số này cho toàn công ty để xem các thương vụ của Amir có nhiều hay ít người dùng hơn mức trung bình của công ty. Vấn đề là trong năm vừa rồi, công ty đã xử lý hơn mười nghìn thương vụ, nên việc tổng hợp toàn bộ dữ liệu là không thực tế. Thay vào đó, bạn sẽ ước lượng trung bình bằng cách lấy một số mẫu ngẫu nhiên các thương vụ, vì cách này dễ hơn nhiều so với việc thu thập dữ liệu từ tất cả mọi người trong công ty.

amir_deals đã có sẵn và dữ liệu người dùng cho tất cả thương vụ của công ty có trong all_deals. Cả pandas (viết tắt là pd) và numpy (viết tắt là np) đều đã được nạp.

Hướng dẫn

100 XP
  • Đặt hạt giống ngẫu nhiên (random seed) là 321.
  • Lấy 30 mẫu (có hoàn lại) với kích thước 20 từ all_deals['num_users'] và tính trung bình của mỗi mẫu. Lưu các giá trị trung bình mẫu vào sample_means.
  • In ra trung bình của sample_means.
  • In ra trung bình của cột num_users trong amir_deals.