Erste SchritteKostenlos loslegen

Blockieren experimenteller Daten

Du arbeitest mit einem Produktionsunternehmen zusammen, das einige Experimente zur Produktivität der Arbeiter durchführen möchte. Ihr Datensatz enthält nur 100 Zeilen, deshalb ist es wichtig, dass die Versuchsgruppen ausgewogen sind.

Das klingt nach einer großartigen Gelegenheit, dein Wissen über das Blockieren zu nutzen, um ihnen zu helfen. Sie haben einen productivity_subjects DataFrame zur Verfügung gestellt. Teile den bereitgestellten Datensatz in zwei gleich große Gruppen mit jeweils 50 Einträgen.

Die Bibliotheken numpy und pandas wurden als np bzw. pd importiert.

Diese Übung ist Teil des Kurses

Versuchsplanung in Python

Kurs anzeigen

Anleitung zur Übung

  • Wähle nach dem Zufallsprinzip 50 Probanden aus dem DataFrame productivity_subjects aus und füge sie ersatzlos in einen neuen DataFrame block_1 ein.
  • Setze eine neue Spalte, block auf 1 für den block_1 DataFrame.
  • Ordne die übrigen Fächer einem DataFrame namens block_2 zu und setze die Spalte block für diesen DataFrame auf 2.
  • Verbinde die Blöcke zu einem einzigen DataFrame und gib die Anzahl der einzelnen Werte in der Spalte block aus, um zu bestätigen, dass die Blockierung funktioniert hat.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Bearbeiten und Ausführen von Code