LoslegenKostenlos starten

Blocking von experimentellen Daten

Du arbeitest mit einem Produktionsunternehmen zusammen, das Experimente zur Arbeitsproduktivität durchführen möchte. Der Datensatz umfasst nur 100 Zeilen, daher ist es wichtig, dass die Experimentalgruppen ausgewogen sind.

Das ist eine gute Gelegenheit, dein Wissen über Blocking einzusetzen. Sie haben ein DataFrame productivity_subjects bereitgestellt. Teile den Datensatz in zwei gleich große Gruppen mit jeweils 50 Einträgen auf.

Die Bibliotheken numpy und pandas wurden bereits als np bzw. pd importiert.

Diese Übung ist Teil des Kurses

<Kurs>Versuchsplanung mit Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Wähle zufällig 50 Personen aus dem DataFrame productivity_subjects ohne Zurücklegen in ein neues DataFrame block_1 aus.
  • Setze für das DataFrame block_1 eine neue Spalte block auf den Wert 1.
  • Weise die verbleibenden Personen einem DataFrame block_2 zu und setze die Spalte block für dieses DataFrame auf 2.
  • Fasse die Blöcke zu einem einzigen DataFrame zusammen und gib die Häufigkeit der Werte in der Spalte block aus, um zu bestätigen, dass das Blocking funktioniert hat.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Code bearbeiten und ausführen