Réplication d’échantillons
Lorsque vous calculez une estimation ponctuelle telle que la moyenne d’un échantillon, la valeur que vous calculez dépend des lignes qui ont été incluses dans l’échantillon. Cela signifie qu’il y a une part aléatoire dans la réponse. Afin de quantifier la variation causée par ce caractère aléatoire, vous pouvez créer de nombreux échantillons et calculer la moyenne de l’échantillon (ou une autre statistique) pour chaque échantillon.
attrition_pop
est disponible. pandas
et matplotlib.pyplot
sont chargés avec leurs alias habituels.
Cet exercice fait partie du cours
L’échantillonnage en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create an empty list
____
# Loop 500 times to create 500 sample means
____:
mean_attritions.append(
attrition_pop.sample(n=60)['Attrition'].mean()
)
# Print out the first few entries of the list
print(mean_attritions[0:5])