Ortamaların ortalaması
Bir anlaşma başına ortalama kullanıcı sayısını (num_users) bilmek istiyorsun, ama bunu tüm şirket için bilmek istiyorsun ki Amir'in anlaşmalarındaki kullanıcı sayısı şirketin ortalama anlaşmasına göre daha fazla mı daha az mı görebilesin. Sorun şu ki, son bir yılda şirket on binden fazla anlaşma üzerinde çalıştı, bu yüzden tüm verileri derlemek gerçekçi değil. Bunun yerine, şirketin tamamından veri toplamak yerine çok daha kolay olduğu için, birkaç rastgele anlaşma örneği alarak ortalamayı tahmin edeceksin.
amir_deals hazır ve şirketin tüm anlaşmalarına ait kullanıcı verileri all_deals içinde mevcut. Hem pandas pd olarak hem de numpy np olarak yüklü.
Bu egzersiz
Python ile İstatistiğe Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Rastgelelik tohumunu
321olarak ayarla. all_deals['num_users']içinden, 20 büyüklüğünde ve yerine koymalı olacak şekilde 30 örnek al ve her örneğin ortalamasını hesapla. Örnek ortalamalarınısample_meansiçinde sakla.sample_means'in ortalamasını yazdır.amir_dealsveri çerçevesininnum_userssütununun ortalamasını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)