Échantillonnage pondéré
L’échantillonnage stratifié définit des règles sur la probabilité de sélectionner des lignes de votre jeu de données au niveau des sous-groupes. Une généralisation de cette idée est l’échantillonnage pondéré, qui vous permet de spécifier des règles sur la probabilité de sélectionner des lignes au niveau de chaque ligne. La probabilité de sélectionner une ligne donnée est proportionnelle à la valeur de poids associée à cette ligne.
attrition_pop est disponible ; dplyr et ggplot2 sont chargés.
Cet exercice fait partie du cours
Échantillonnage en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Using attrition_pop, plot YearsAtCompany as a histogram with binwidth 1
___