Erste SchritteKostenlos loslegen

Der Mittelwert der Mittel

Du möchtest wissen, wie hoch die durchschnittliche Anzahl der Nutzer (num_users) pro Geschäft ist, aber du möchtest diese Zahl für das gesamte Unternehmen wissen, damit du sehen kannst, ob Amirs Geschäfte mehr oder weniger Nutzer haben als das durchschnittliche Geschäft des Unternehmens. Das Problem ist, dass das Unternehmen im letzten Jahr an mehr als zehntausend Geschäften gearbeitet hat, sodass es nicht realistisch ist, alle Daten zusammenzustellen. Stattdessen schätzt du den Mittelwert, indem du mehrere Stichproben von Geschäften nimmst, denn das ist viel einfacher, als Daten von allen Mitarbeitern des Unternehmens zu sammeln.

amir_deals ist verfügbar, und die Nutzerdaten für alle Angebote des Unternehmens sind unter all_deals abrufbar. Sowohl pandas als pd als auch numpy als np werden geladen.

Diese Übung ist Teil des Kurses

Einführung in die Statistik in Python

Kurs anzeigen

Anleitung zur Übung

  • Setze den Zufallsstartwert auf 321.
  • Nimm 30 Stichproben (mit Ersatz) der Größe 20 von all_deals['num_users'], und ermittle den Mittelwert jeder Stichprobe. Speichere die Stichprobenmittelwerte in sample_means.
  • Gib den Mittelwert von sample_means aus.
  • Gib den Mittelwert der Spalte num_users von amir_deals aus.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)
Bearbeiten und Ausführen von Code