Blockieren experimenteller Daten
Du arbeitest mit einem Produktionsunternehmen zusammen, das einige Experimente zur Produktivität der Arbeiter durchführen möchte. Ihr Datensatz enthält nur 100 Zeilen, deshalb ist es wichtig, dass die Versuchsgruppen ausgewogen sind.
Das klingt nach einer großartigen Gelegenheit, dein Wissen über das Blockieren zu nutzen, um ihnen zu helfen. Sie haben einen productivity_subjects DataFrame zur Verfügung gestellt. Teile den bereitgestellten Datensatz in zwei gleich große Gruppen mit jeweils 50 Einträgen.
Die Bibliotheken numpy und pandas wurden als np bzw. pd importiert.
Diese Übung ist Teil des Kurses
Versuchsplanung in Python
Anleitung zur Übung
- Wähle nach dem Zufallsprinzip 50 Probanden aus dem DataFrame
productivity_subjectsaus und füge sie ersatzlos in einen neuen DataFrameblock_1ein. - Setze eine neue Spalte,
blockauf 1 für denblock_1DataFrame. - Ordne die übrigen Fächer einem DataFrame namens
block_2zu und setze die Spalteblockfür diesen DataFrame auf 2. - Verbinde die Blöcke zu einem einzigen DataFrame und gib die Anzahl der einzelnen Werte in der Spalte
blockaus, um zu bestätigen, dass die Blockierung funktioniert hat.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)
# Set the block column
block_1['block'] = ____
# Create second assignment and label
block_2 = ____
block_2['block'] = ____
# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())