CommencerCommencez gratuitement

Affectation non aléatoire des sujets

Une entreprise agricole mène une expérience pour mesurer l’effet de différents types d’herbe sur le poids des moutons. Elle vous demande de l’aider à mettre correctement en place l’expérience. L’un des responsables a suggéré d’affecter les sujets en prenant les 250 premières lignes du DataFrame, estimant que cela suffira.

Votre mission est d’utiliser vos compétences d’analyse pour montrer pourquoi ce n’est peut‑être pas une bonne idée. Affectez les sujets à deux groupes via une affectation non aléatoire (les 250 premières lignes) et observez les différences dans les statistiques descriptives.

Vous avez reçu le DataFrame weights, qui contient une colonne weight avec le poids des moutons et une colonne id unique.

numpy et pandas ont été importés sous les alias np et pd, respectivement.

Cet exercice fait partie du cours

<cours>Conception expérimentale en Python</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez le découpage de DataFrame pour placer les 250 premières lignes de weights dans group1_non_rand et le reste dans group2_non_rand.
  • Générez les statistiques descriptives des deux groupes et concaténez‑les dans un seul DataFrame.
  • Affichez le résultat pour observer les différences.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Non-random assignment
group1_non_rand = ____
group2_non_rand = ____

# Compare descriptive statistics of groups
compare_df_non_rand = ____([group1_non_rand['weight'].____, group2_non_rand['weight'].____], axis=1)
compare_df_non_rand.columns = ['group1', 'group2']

# Print to assess
print(____)
Modifier et exécuter le code