Der Mittelwert der Mittel
Du möchtest wissen, wie hoch die durchschnittliche Anzahl der Nutzer (num_users
) pro Deal ist, aber du willst diese Zahl für das gesamte Unternehmen in Erfahrung bringen, damit du erfahren kannst, ob Amirs Deal mehr oder weniger Nutzer haben als der durchschnittliche Deal des Unternehmens. Das Problem ist, dass das Unternehmen im letzten Jahr an mehr als zehntausend Deals gearbeitet hat, sodass es nicht realistisch ist, alle Daten zusammenzutragen. Stattdessen schätzt du den Mittelwert, indem du mehrere Stichproben von Deals nimmst, denn das ist viel einfacher, als Daten von allen Mitarbeitern des Unternehmens zu sammeln.
amir_deals
ist verfügbar, und die Nutzerdaten für alle Deals des Unternehmens sind unter all_deals
abrufbar. Sowohl pandas
als pd
als auch numpy
als np
werden geladen.
Diese Übung ist Teil des Kurses
Einführung in die Statistik in Python
Anleitung zur Übung
- Setze den Zufallsstartwert auf
321
. - Nimm 30 Stichproben (mit Zurücklegen) der Größe 20 von
all_deals['num_users']
, und ermittle den Mittelwert jeder Stichprobe. Speichere die Stichprobenmittelwerte insample_means
. - Gib den Mittelwert von
sample_means
aus. - Gib den Mittelwert der Spalte
num_users
vonamir_deals
aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set seed to 321
____
sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
# Take sample of size 20 from num_users col of all_deals with replacement
cur_sample = ____
# Take mean of cur_sample
cur_mean = ____
# Append cur_mean to sample_means
sample_means.append(____)
# Print mean of sample_means
print(____)
# Print mean of num_users in amir_deals
print(____)