Nicht zufällige Zuweisung von Probanden
Ein landwirtschaftliches Unternehmen führt ein Experiment durch, um zu messen, wie sich die Fütterung verschiedener Grasarten auf das Gewicht der Schafe auswirkt. Sie haben dich um deine Hilfe gebeten, um das Experiment richtig vorzubereiten. Einer ihrer Manager hat gesagt, dass du die Betreff-Zuordnung vornehmen kannst, indem du die obersten 250 Zeilen aus dem DataFrame nimmst, und das sollte in Ordnung sein.
Deine Aufgabe ist es, mit deinen analytischen Fähigkeiten zu zeigen, warum das keine gute Idee ist. Ordne die Probanden nicht zufällig zwei Gruppen zu (die ersten 250 Zeilen) und beobachte die Unterschiede in der deskriptiven Statistik.
Du hast den DataFrame weights
erhalten, der eine Spalte mit den weight
der Schafe und eine eindeutige Spalte id
enthält.
numpy
und pandas
wurden als np
bzw. pd
importiert.
Diese Übung ist Teil des Kurses
Versuchsplanung in Python
Anleitung zur Übung
- Verwende DataFrame Slicing, um die ersten 250 Zeilen von
weights
ingroup1_non_rand
und die restlichen Zeilen ingroup2_non_rand
einzufügen. - Erstelle deskriptive Statistiken für die beiden Gruppen und füge sie in einem einzigen DataFrame zusammen.
- Drucke sie aus, um die Unterschiede zu beobachten.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Non-random assignment
group1_non_rand = ____
group2_non_rand = ____
# Compare descriptive statistics of groups
compare_df_non_rand = ____([group1_non_rand['weight'].____, group2_non_rand['weight'].____], axis=1)
compare_df_non_rand.columns = ['group1', 'group2']
# Print to assess
print(____)