CommencerCommencer gratuitement

Assignation non aléatoire des sujets

Une entreprise agricole mène une expérience pour mesurer l'impact de l'alimentation des moutons avec différents types d'herbe sur leur poids. Ils ont demandé votre aide pour mettre en place correctement l'expérience. L'un de leurs responsables a déclaré que vous pouviez effectuer l'affectation du sujet en prenant les 250 premières lignes du DataFrame et que cela devrait suffire.

Votre tâche consiste à utiliser vos compétences analytiques pour démontrer pourquoi ce n'est pas une bonne idée. Répartissez les sujets dans deux groupes en utilisant l'assignation non aléatoire (les 250 premières lignes) et observez les différences dans les statistiques descriptives.

Vous avez reçu le DataFrame, weights, qui comporte une colonne contenant le weight du mouton et une colonne unique id.

numpy et pandas ont été importés en tant que np et pd, respectivement.

Cet exercice fait partie du cours

Conception expérimentale en Python

Afficher le cours

Instructions

  • Utilisez le découpage DataFrame pour placer les 250 premières lignes de weights dans group1_non_rand et les autres dans group2_non_rand.
  • Générer des statistiques descriptives des deux groupes et les concaténer dans un seul DataFrame.
  • Imprimez pour observer les différences.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Non-random assignment
group1_non_rand = ____
group2_non_rand = ____

# Compare descriptive statistics of groups
compare_df_non_rand = ____([group1_non_rand['weight'].____, group2_non_rand['weight'].____], axis=1)
compare_df_non_rand.columns = ['group1', 'group2']

# Print to assess
print(____)
Modifier et exécuter le code