Der Mittelwert der Mittel
Du möchtest wissen, wie hoch die durchschnittliche Anzahl der Nutzer (num_users
) pro Geschäft ist, aber du möchtest diese Zahl für das gesamte Unternehmen wissen, damit du sehen kannst, ob Amirs Geschäfte mehr oder weniger Nutzer haben als das durchschnittliche Geschäft des Unternehmens. Das Problem ist, dass das Unternehmen im letzten Jahr an mehr als zehntausend Geschäften gearbeitet hat, sodass es nicht realistisch ist, alle Daten zusammenzustellen. Stattdessen schätzt du den Mittelwert, indem du mehrere Stichproben von Geschäften nimmst, denn das ist viel einfacher, als Daten von allen Mitarbeitern des Unternehmens zu sammeln.
amir_deals
ist verfügbar, und die Nutzerdaten für alle Angebote des Unternehmens sind unter all_deals
abrufbar. Sowohl pandas
als pd
als auch numpy
als np
werden geladen.
Diese Übung ist Teil des Kurses
Einführung in die Statistik in Python
Anleitung zur Übung
- Setze den Zufallsstartwert auf
321
. - Nimm 30 Stichproben (mit Ersatz) der Größe 20 von
all_deals['num_users']
, und ermittle den Mittelwert jeder Stichprobe. Speichere die Stichprobenmittelwerte insample_means
. - Gib den Mittelwert von
sample_means
aus. - Gib den Mittelwert der Spalte
num_users
vonamir_deals
aus.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)