IniziaInizia gratis

Blocco dei dati sperimentali

Stai collaborando con un'azienda manifatturiera che vuole condurre alcuni esperimenti sulla produttività dei lavoratori. Il loro insieme di dati contiene solo 100 righe, quindi è importante che i gruppi sperimentali siano bilanciati.

Questa è un'ottima occasione per usare le tue conoscenze di blocking per aiutarli. Ti hanno fornito un DataFrame productivity_subjects. Suddividi l'insieme di dati in due gruppi uguali da 50 record ciascuno.

Le librerie numpy e pandas sono già state importate rispettivamente come np e pd.

Questo esercizio fa parte del corso

Progettazione Sperimentale in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Seleziona casualmente 50 soggetti dal DataFrame productivity_subjects in un nuovo DataFrame block_1 senza reinserimento.
  • Imposta una nuova colonna block a 1 per il DataFrame block_1.
  • Assegna i soggetti rimanenti a un DataFrame chiamato block_2 e imposta la colonna block a 2 per questo DataFrame.
  • Concatena i due blocchi in un unico DataFrame e stampa il conteggio di ciascun valore nella colonna block per confermare che il blocking ha funzionato.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Modifica ed esegui il codice