Blocking von experimentellen Daten
Du arbeitest mit einem Produktionsunternehmen zusammen, das Experimente zur Arbeitsproduktivität durchführen möchte. Der Datensatz umfasst nur 100 Zeilen, daher ist es wichtig, dass die Experimentalgruppen ausgewogen sind.
Das ist eine gute Gelegenheit, dein Wissen über Blocking einzusetzen. Sie haben ein DataFrame productivity_subjects bereitgestellt. Teile den Datensatz in zwei gleich große Gruppen mit jeweils 50 Einträgen auf.
Die Bibliotheken numpy und pandas wurden bereits als np bzw. pd importiert.
Diese Übung ist Teil des Kurses
<Kurs>Versuchsplanung mit Python</Kurs>Übungsanweisungen
- Wähle zufällig 50 Personen aus dem DataFrame
productivity_subjectsohne Zurücklegen in ein neues DataFrameblock_1aus. - Setze für das DataFrame
block_1eine neue Spalteblockauf den Wert 1. - Weise die verbleibenden Personen einem DataFrame
block_2zu und setze die Spalteblockfür dieses DataFrame auf 2. - Fasse die Blöcke zu einem einzigen DataFrame zusammen und gib die Häufigkeit der Werte in der Spalte
blockaus, um zu bestätigen, dass das Blocking funktioniert hat.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)
# Set the block column
block_1['block'] = ____
# Create second assignment and label
block_2 = ____
block_2['block'] = ____
# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())