Rata-rata dari rata-rata
Anda ingin mengetahui berapa rata-rata jumlah pengguna (num_users) per kesepakatan, namun Anda ingin mengetahui angka ini untuk seluruh perusahaan agar dapat melihat apakah kesepakatan Amir memiliki jumlah pengguna lebih banyak atau lebih sedikit dibandingkan rata-rata kesepakatan perusahaan. Masalahnya, selama setahun terakhir, perusahaan telah menangani lebih dari sepuluh ribu kesepakatan, sehingga tidak realistis untuk mengompilasi semua datanya. Sebagai gantinya, Anda akan memperkirakan mean dengan mengambil beberapa sampel acak dari kesepakatan, karena ini jauh lebih mudah daripada mengumpulkan data dari semua orang di perusahaan.
amir_deals tersedia dan data pengguna untuk semua kesepakatan perusahaan tersedia dalam all_deals. Baik pandas sebagai pd maupun numpy sebagai np sudah dimuat.
Latihan ini adalah bagian dari kursus
Pengantar Statistika di Python
Petunjuk latihan
- Atur seed acak ke
321. - Ambil 30 sampel (dengan pengembalian) berukuran 20 dari
all_deals['num_users']dan hitung mean dari setiap sampel. Simpan mean sampel tersebut dalamsample_means. - Cetak mean dari
sample_means. - Cetak mean dari kolom
num_userspadaamir_deals.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)