Blockieren experimenteller Daten
Du arbeitest mit einem Produktionsunternehmen zusammen, das einige Experimente zur Produktivität der Arbeiter durchführen möchte. Ihr Datensatz enthält nur 100 Zeilen, deshalb ist es wichtig, dass die Versuchsgruppen ausgewogen sind.
Das klingt nach einer großartigen Gelegenheit, dein Wissen über das Blockieren zu nutzen, um ihnen zu helfen. Sie haben einen productivity_subjects
DataFrame zur Verfügung gestellt. Teile den bereitgestellten Datensatz in zwei gleich große Gruppen mit jeweils 50 Einträgen.
Die Bibliotheken numpy
und pandas
wurden als np
bzw. pd
importiert.
Diese Übung ist Teil des Kurses
Versuchsplanung in Python
Anleitung zur Übung
- Wähle nach dem Zufallsprinzip 50 Probanden aus dem DataFrame
productivity_subjects
aus und füge sie ersatzlos in einen neuen DataFrameblock_1
ein. - Setze eine neue Spalte,
block
auf 1 für denblock_1
DataFrame. - Ordne die übrigen Fächer einem DataFrame namens
block_2
zu und setze die Spalteblock
für diesen DataFrame auf 2. - Verbinde die Blöcke zu einem einzigen DataFrame und gib die Anzahl der einzelnen Werte in der Spalte
block
aus, um zu bestätigen, dass die Blockierung funktioniert hat.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)
# Set the block column
block_1['block'] = ____
# Create second assignment and label
block_2 = ____
block_2['block'] = ____
# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())