Affectation non aléatoire des sujets
Une entreprise agricole mène une expérience pour mesurer l’effet de différents types d’herbe sur le poids des moutons. Elle vous demande de l’aider à mettre correctement en place l’expérience. L’un des responsables a suggéré d’affecter les sujets en prenant les 250 premières lignes du DataFrame, estimant que cela suffira.
Votre mission est d’utiliser vos compétences d’analyse pour montrer pourquoi ce n’est peut‑être pas une bonne idée. Affectez les sujets à deux groupes via une affectation non aléatoire (les 250 premières lignes) et observez les différences dans les statistiques descriptives.
Vous avez reçu le DataFrame weights, qui contient une colonne weight avec le poids des moutons et une colonne id unique.
numpy et pandas ont été importés sous les alias np et pd, respectivement.
Cet exercice fait partie du cours
<cours>Conception expérimentale en Python</cours>Instructions de l’exercice
- Utilisez le découpage de DataFrame pour placer les 250 premières lignes de
weightsdansgroup1_non_randet le reste dansgroup2_non_rand. - Générez les statistiques descriptives des deux groupes et concaténez‑les dans un seul DataFrame.
- Affichez le résultat pour observer les différences.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Non-random assignment
group1_non_rand = ____
group2_non_rand = ____
# Compare descriptive statistics of groups
compare_df_non_rand = ____([group1_non_rand['weight'].____, group2_non_rand['weight'].____], axis=1)
compare_df_non_rand.columns = ['group1', 'group2']
# Print to assess
print(____)