Inizia subitoInizia gratis

Blocco dei dati sperimentali

Stai collaborando con un'azienda manifatturiera che vuole condurre alcuni esperimenti sulla produttività dei lavoratori. Il loro insieme di dati contiene solo 100 righe, quindi è importante che i gruppi sperimentali siano bilanciati.

Questa è un'ottima occasione per usare le tue conoscenze di blocking per aiutarli. Ti hanno fornito un DataFrame productivity_subjects. Suddividi l'insieme di dati in due gruppi uguali da 50 record ciascuno.

Le librerie numpy e pandas sono già state importate rispettivamente come np e pd.

Questo esercizio fa parte del corso

Progettazione Sperimentale in Python

Visualizza corso

Istruzioni dell'esercizio

  • Seleziona casualmente 50 soggetti dal DataFrame productivity_subjects in un nuovo DataFrame block_1 senza reinserimento.
  • Imposta una nuova colonna block a 1 per il DataFrame block_1.
  • Assegna i soggetti rimanenti a un DataFrame chiamato block_2 e imposta la colonna block a 2 per questo DataFrame.
  • Concatena i due blocchi in un unico DataFrame e stampa il conteggio di ciascun valore nella colonna block per confermare che il blocking ha funzionato.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Modifica ed esegui il codice