Ortamaların ortalaması

Bir anlaşma başına ortalama kullanıcı sayısını (num_users) bilmek istiyorsun, ama bunu tüm şirket için bilmek istiyorsun ki Amir'in anlaşmalarındaki kullanıcı sayısı şirketin ortalama anlaşmasına göre daha fazla mı daha az mı görebilesin. Sorun şu ki, son bir yılda şirket on binden fazla anlaşma üzerinde çalıştı, bu yüzden tüm verileri derlemek gerçekçi değil. Bunun yerine, şirketin tamamından veri toplamak yerine çok daha kolay olduğu için, birkaç rastgele anlaşma örneği alarak ortalamayı tahmin edeceksin.

amir_deals hazır ve şirketin tüm anlaşmalarına ait kullanıcı verileri all_deals içinde mevcut. Hem pandas pd olarak hem de numpy np olarak yüklü.

Bu egzersiz, kursun bir parçasıdır

Python ile İstatistiğe Giriş

Kursa Göz Atın

Egzersiz talimatları

Rastgelelik tohumunu 321 olarak ayarla.
all_deals['num_users'] içinden, 20 büyüklüğünde ve yerine koymalı olacak şekilde 30 örnek al ve her örneğin ortalamasını hesapla. Örnek ortalamalarını sample_means içinde sakla.
sample_means'in ortalamasını yazdır.
amir_deals veri çerçevesinin num_users sütununun ortalamasını yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Python ile İstatistiğe Giriş

IntermediárioNível de habilidade

4.8+

Kursa Ücretsiz Başla

Özet istatistikler, büyük veri kümelerini damıtarak en önemli noktaları ortaya çıkarmana yardımcı olur. Bu bölümde, ortalama, medyan ve standart sapma gibi özet istatistikleri inceleyecek ve onları doğru şekilde yorumlamayı öğreneceksin. Ayrıca eleştirel düşünme becerilerini geliştirerek verin için en uygun özet istatistikleri seçebileceksin.

Exercise 1: İstatistik nedir?Exercise 2: Betimsel ve çıkarımsal istatistik Exercise 3: Veri türü sınıflandırması Exercise 4: Merkez ölçüleri Exercise 5: Ortalama ve medyanı hesaplama Exercise 6: Ortalama, medyan ve dağılım şekli Exercise 7: Yayılım ölçüleri Exercise 8: Varyans ve standart sapma Exercise 9: Çeyrekler, kantiller ve beşlikler Exercise 10: IQR kullanarak aykırı değerleri bulma

Bu bölümde rastgele örnekler üretmeyi ve olasılık kullanarak şansı ölçmeyi öğreneceksin. Gerçek dünyadan satış verileriyle çalışarak bir satış elemanının başarılı olma olasılığını hesaplayacaksın. Son olarak, ikili sonuçları olan olayları modellemek için binom dağılımını kullanacaksın.

Exercise 1: Şansın ne kadar?Exercise 2: Yerine koyarak mı, koymadan mı?Exercise 3: Olasılıkları hesaplama Exercise 4: Anlaşmaları örnekleme Exercise 5: Ayrık dağılımlar Exercise 6: Olasılık dağılımı oluşturma Exercise 7: Dağılımları belirleme Exercise 8: Beklenen değer vs. örneklem ortalaması Exercise 9: Sürekli dağılımlar Exercise 10: Hangi dağılım?Exercise 11: Veri yedeklemeleri Exercise 12: Bekleme sürelerini simüle etme Exercise 13: Binom dağılımı Exercise 14: Satış anlaşmalarını simüle etme Exercise 15: Binom olasılıklarını hesaplama Exercise 16: Kaç satış kazanılacak?

Şimdi istatistikteki en önemli olasılık dağılımlarından biri olan normal dağılımı keşfetme zamanı. Normal dağılımları çizmek için histogramlar oluşturacak ve merkezi limit teoremini anlayacaksın; ardından bilgi dağarcığına Poisson, üstel ve t-dağılımını ekleyerek istatistiksel fonksiyonlar hakkındaki bilgini genişleteceksin.

Exercise 1: Normal dağılım Exercise 2: Amir'in satışlarının dağılımı Exercise 3: Normal dağılımdan olasılıklar Exercise 4: Yeni pazar koşullarında satışları simüle etme Exercise 5: Hangi pazar daha iyi?Exercise 6: Merkezi limit teoremi Exercise 7: Örnekleme dağılımlarını görselleştirme Exercise 8: CLT iş başında Exercise 9: Ortamaların ortalaması

Geçerli egzersiz

Exercise 10: Poisson dağılımı Exercise 11: Lambda'yı belirleme Exercise 12: Potansiyel müşteri yanıtlarını izleme Exercise 13: Daha fazla olasılık dağılımı Exercise 14: Dağılımları sürükle-bırak Exercise 15: Aday müşteri talepleri arasındaki zamanı modelleme Exercise 16: t-dağılımı

Bu bölümde iki değişken arasındaki doğrusal ilişkinin gücünü nasıl nicelleştireceğini ve karıştırıcı değişkenlerin iki başka değişken arasındaki ilişkiyi nasıl etkileyebileceğini keşfedeceksin. Ayrıca bir çalışmanın tasarımının sonuçları nasıl etkileyebileceğini, verilerin nasıl analiz edilmesi gerektiğini nasıl değiştirebileceğini ve çıkarımlarının güvenilirliğini nasıl etkileyebileceğini göreceksin.

Exercise 1: Korelasyon Exercise 2: Korelasyonu tahmin et Exercise 3: Değişkenler arasındaki ilişkiler Exercise 4: Korelasyonun dikkat edilmesi gerekenleri Exercise 5: Korelasyon neyi ölçemez?Exercise 6: Değişkenleri dönüştürme Exercise 7: Şeker mutluluğu artırır mı?Exercise 8: Karıştırıcılar Exercise 9: Deney tasarımı Exercise 10: Çalışma türleri Exercise 11: Boylamsal ve kesitsel çalışmalar Exercise 12: Tebrikler!