Échantillonnage pondéré
L’échantillonnage stratifié fournit des règles sur la probabilité de sélectionner des lignes de votre ensemble de données au niveau du sous-groupe. Une généralisation de cette méthode est l’échantillonnage pondéré, qui vous permet de spécifier des règles sur la probabilité de sélectionner des lignes au niveau de la ligne. La probabilité de choisir une ligne donnée est proportionnelle à la valeur de la pondération de cette ligne.
attrition_pop
est disponible. pandas
, matplotlib.pyplot
, et numpy
sont chargés avec leurs alias habituels.
Cet exercice fait partie du cours
L’échantillonnage en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plot YearsAtCompany from attrition_pop as a histogram
____
plt.show()