Blocco dei dati sperimentali

Stai collaborando con un'azienda manifatturiera che vuole condurre alcuni esperimenti sulla produttività dei lavoratori. Il loro insieme di dati contiene solo 100 righe, quindi è importante che i gruppi sperimentali siano bilanciati.

Questa è un'ottima occasione per usare le tue conoscenze di blocking per aiutarli. Ti hanno fornito un DataFrame productivity_subjects. Suddividi l'insieme di dati in due gruppi uguali da 50 record ciascuno.

Le librerie numpy e pandas sono già state importate rispettivamente come np e pd.

Questo esercizio fa parte del corso

Progettazione Sperimentale in Python

Visualizza corso

Istruzioni dell'esercizio

Seleziona casualmente 50 soggetti dal DataFrame productivity_subjects in un nuovo DataFrame block_1 senza reinserimento.
Imposta una nuova colonna block a 1 per il DataFrame block_1.
Assegna i soggetti rimanenti a un DataFrame chiamato block_2 e imposta la colonna block a 2 per questo DataFrame.
Concatena i due blocchi in un unico DataFrame e stampa il conteggio di ciascun valore nella colonna block per confermare che il blocking ha funzionato.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Progettazione Sperimentale in Python

IntermediárioNível de habilidade

4.8+

Inizia il corso gratuitamente

Costruire competenze nella progettazione sperimentale ti permette di testare ipotesi con strumenti analitici consolidati e di quantificare il rischio del tuo lavoro. Inizierai definendo cos’è la progettazione sperimentale e i diversi schemi, come blocking e stratificazione. Poi imparerai e applicherai test visivi e analitici di normalità sui dati sperimentali.

Exercise 1: Impostare gli esperimenti Exercise 2: Assegnazione non casuale dei soggetti Exercise 3: Assegnazione casuale dei soggetti Exercise 4: Impostazione dei dati sperimentali Exercise 5: Blocco dei dati sperimentali

Esercizio attuale

Exercise 6: Stratificare un esperimento Exercise 7: Quale è stato stratificato?Exercise 8: Dati normali Exercise 9: Normalità visiva in un esperimento agricolo Exercise 10: Normalità analitica in un esperimento agricolo

Approfondirai tecniche sofisticate di progettazione sperimentale, concentrandoti su factorial design, randomized block design e correzioni per covariate. Queste metodologie sono fondamentali per migliorare accuratezza, efficienza e interpretabilità dei risultati sperimentali. Grazie a una combinazione di teoria e applicazioni pratiche, acquisirai le competenze per progettare, implementare e analizzare esperimenti complessi in diversi ambiti di ricerca.

Exercise 1: Schemi fattoriali: principi e applicazioni Exercise 2: Capire l'efficacia di una campagna di marketing Exercise 3: Heatmap delle interazioni della campagna Exercise 4: Disegni fattoriali e disegni a blocchi randomizzati Exercise 5: Randomized block design: controllare la varianza Exercise 6: Implementare un randomized block design Exercise 7: Visualizzare la produttività nei blocchi per incentivo Exercise 8: ANOVA all'interno dei blocchi di dipendenti Exercise 9: Aggiustamento per covariate nel disegno sperimentale Exercise 10: Importanza delle covariate Exercise 11: Correzione per covariate con la crescita dei pulcini

Padroneggia test statistici come t-test, ANOVA e Chi-quadro, e approfondisci le analisi post-hoc e le basi della power analysis. Impara a scegliere il test giusto, interpretare p-value ed errori, e condurre con sicurezza una power analysis per determinare dimensione del campione e dell’effetto, sfruttando le potenti librerie di Python per dare vita agli insight sui tuoi dati.

Exercise 1: Scegliere il test statistico giusto Exercise 2: Scegliere il test giusto: petrolchimici Exercise 3: Scegliere il test giusto: risorse umane Exercise 4: Scegliere il test giusto: finanza Exercise 5: Analisi post-hoc dopo l'ANOVA Exercise 6: ANOVA sui trattamenti per l'ansia Exercise 7: Applicare l'HSD di Tukey Exercise 8: Applicare la correzione di Bonferroni Exercise 9: P-value, alpha ed errori Exercise 10: Analizzare la durabilità dei giocattoli Exercise 11: Visualizzare le differenze di durata Exercise 12: Ruolo dei livelli di significatività Exercise 13: Power analysis: dimensione del campione ed entità dell'effetto Exercise 14: Scopo dell'effect size Exercise 15: Stima della dimensione campionaria necessaria per lo studio sull'energia

Addentrati nelle complessità dell’analisi dei dati sperimentali. Impara a sintetizzare insight con pandas, a gestire problematiche come l’eteroschedasticità con scipy.stats e ad applicare test non parametrici come Mann-Whitney U. Scopri tecniche aggiuntive per trasformare, visualizzare e interpretare dati complessi, potenziando la tua capacità di condurre analisi robuste in diversi contesti sperimentali.

Exercise 1: Sintetizzare insight da esperimenti complessi Exercise 2: Visualizzare il rendimento di approvazione dei prestiti Exercise 3: Esplorare la soddisfazione dei clienti Exercise 4: Comunicare in modo efficace i dati sperimentali Exercise 5: Affrontare le complessità nei dati sperimentali Exercise 6: Verifica l'eteroschedasticità nella shelf life Exercise 7: Esplorare e trasformare i dati sulla shelf life Exercise 8: Applicare test non parametrici nell'analisi sperimentale Exercise 9: Visualizzare e testare i metodi di conservazione Exercise 10: Analisi approfondita delle tecniche di conservazione degli alimenti Exercise 11: Congratulazioni!