Assignation non aléatoire des sujets
Une entreprise agricole mène une expérience pour mesurer l'impact de l'alimentation des moutons avec différents types d'herbe sur leur poids. Ils ont demandé votre aide pour mettre en place correctement l'expérience. L'un de leurs responsables a déclaré que vous pouviez effectuer l'affectation du sujet en prenant les 250 premières lignes du DataFrame et que cela devrait suffire.
Votre tâche consiste à utiliser vos compétences analytiques pour démontrer pourquoi ce n'est pas une bonne idée. Répartissez les sujets dans deux groupes en utilisant l'assignation non aléatoire (les 250 premières lignes) et observez les différences dans les statistiques descriptives.
Vous avez reçu le DataFrame, weights
, qui comporte une colonne contenant le weight
du mouton et une colonne unique id
.
numpy
et pandas
ont été importés en tant que np
et pd
, respectivement.
Cet exercice fait partie du cours
Conception expérimentale en Python
Instructions
- Utilisez le découpage DataFrame pour placer les 250 premières lignes de
weights
dansgroup1_non_rand
et les autres dansgroup2_non_rand
. - Générer des statistiques descriptives des deux groupes et les concaténer dans un seul DataFrame.
- Imprimez pour observer les différences.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Non-random assignment
group1_non_rand = ____
group2_non_rand = ____
# Compare descriptive statistics of groups
compare_df_non_rand = ____([group1_non_rand['weight'].____, group2_non_rand['weight'].____], axis=1)
compare_df_non_rand.columns = ['group1', 'group2']
# Print to assess
print(____)