CommencerCommencer gratuitement

Échantillonnage pondéré

L’échantillonnage stratifié fournit des règles sur la probabilité de sélectionner des lignes de votre ensemble de données au niveau du sous-groupe. Une généralisation de cette méthode est l’échantillonnage pondéré, qui vous permet de spécifier des règles sur la probabilité de sélectionner des lignes au niveau de la ligne. La probabilité de choisir une ligne donnée est proportionnelle à la valeur de la pondération de cette ligne.

attrition_pop est disponible. pandas, matplotlib.pyplot, et numpy sont chargés avec leurs alias habituels.

Cet exercice fait partie du cours

L’échantillonnage en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Plot YearsAtCompany from attrition_pop as a histogram
____
plt.show()
Modifier et exécuter le code