Bloquer des données expérimentales

Vous travaillez avec une entreprise industrielle qui souhaite mener des expériences sur la productivité des employés. Leur jeu de données ne contient que 100 lignes ; il est donc essentiel d’équilibrer les groupes expérimentaux.

C’est une excellente occasion d’appliquer vos connaissances du blocage pour les aider. Ils vous ont fourni un DataFrame productivity_subjects. Scindez le jeu de données fourni en deux groupes égaux de 50 enregistrements chacun.

Les bibliothèques numpy et pandas ont été importées respectivement sous les alias np et pd.

Cet exercice fait partie du cours

<cours>Conception expérimentale en Python</cours>

Instructions de l’exercice

Sélectionnez aléatoirement 50 sujets du DataFrame productivity_subjects dans un nouveau DataFrame block_1, sans remise.
Ajoutez une nouvelle colonne block avec la valeur 1 pour le DataFrame block_1.
Assignez les sujets restants à un DataFrame appelé block_2 et définissez la colonne block à 2 pour ce DataFrame.
Concaténez les deux blocs en un seul DataFrame, puis affichez le nombre d’occurrences de chaque valeur de la colonne block pour confirmer que le blocage a bien fonctionné.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())

Modifier et exécuter le code

Cet exercice fait partie du cours

<cours>Conception expérimentale en Python</cours>

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Développer vos connaissances en conception expérimentale vous permet de tester des hypothèses avec des outils d’analyse éprouvés et de quantifier le risque de vos travaux. Vous commencerez par poser les bases de la conception expérimentale et par explorer différents plans, comme le blocage et la stratification. Vous apprendrez ensuite à appliquer des tests visuels et analytiques de normalité sur des données expérimentales.

Exercise 1: Mettre en place des expériences Exercise 2: Affectation non aléatoire des sujets Exercise 3: Affectation aléatoire des sujets Exercise 4: Mise en place des données expérimentales Exercise 5: Bloquer des données expérimentales

Exercice actuel

Exercise 6: Stratifier une expérience Exercise 7: Lequel a été stratifié ?Exercise 8: Données normales Exercise 9: Normalité visuelle dans une expérience agricole Exercise 10: Normalité analytique dans une expérience agricole

Vous étudierez des techniques avancées de conception expérimentale, en vous concentrant sur les plans factoriels, les plans en blocs aléatoires et l’ajustement sur covariables. Ces méthodologies sont essentielles pour améliorer la précision, l’efficacité et l’interprétabilité des résultats expérimentaux. Grâce à un mélange d’enseignements théoriques et d’applications pratiques, vous acquerrez les compétences nécessaires pour concevoir, mettre en œuvre et analyser des expériences complexes dans divers domaines de recherche.

Exercise 1: Plans factoriels : principes et applications Exercise 2: Comprendre l’efficacité d’une campagne marketing Exercise 3: Carte thermique des interactions de campagne Exercise 4: Plans factoriels et plans en blocs randomisés Exercise 5: Plan en blocs randomisés : contrôler la variance Exercise 6: Mettre en œuvre un plan en blocs aléatoires Exercise 7: Visualiser la productivité par bloc et par incitation Exercise 8: ANOVA au sein des blocs d’employés Exercise 9: Ajustement par covariables dans la conception expérimentale Exercise 10: Importance des covariables Exercise 11: Ajustement par covariable avec la croissance des poussins

Maîtrisez des tests statistiques comme les tests t, l’ANOVA et le Chi carré, et approfondissez les analyses post hoc ainsi que les principes de l’analyse de puissance. Apprenez à sélectionner le bon test, interpréter les p-values et les erreurs, et à mener une analyse de puissance pour déterminer la taille d’échantillon et la taille d’effet, tout en tirant parti des bibliothèques Python pour donner vie à vos insights.

Exercise 1: Choisir le bon test statistique Exercise 2: Choisir le bon test : pétrochimie Exercise 3: Choisir le bon test : ressources humaines Exercise 4: Choisir le bon test : finance Exercise 5: Analyse post-hoc après une ANOVA Exercise 6: ANOVA sur les traitements de l’anxiété Exercise 7: Appliquer le test HSD de Tukey Exercise 8: Appliquer la correction de Bonferroni Exercise 9: Valeurs p, alpha et erreurs Exercise 10: Analyser la durabilité des jouets Exercise 11: Visualiser les différences de durabilité Exercise 12: Rôle des seuils de significativité Exercise 13: Analyse de puissance : taille d’échantillon et taille d’effet Exercise 14: Objectif de la taille d'effet Exercise 15: Estimer la taille d’échantillon nécessaire pour l’étude énergétique

Plongez dans les complexités de l’analyse de données expérimentales. Apprenez à synthétiser des insights avec pandas, à traiter des problèmes de données comme l’hétéroscédasticité avec scipy.stats, et à appliquer des tests non paramétriques comme le test U de Mann-Whitney. Découvrez des techniques supplémentaires pour transformer, visualiser et interpréter des données complexes, afin de renforcer votre capacité à mener des analyses robustes dans divers contextes expérimentaux.

Exercise 1: Synthétiser des enseignements à partir d’expériences complexes Exercise 2: Visualiser le rendement d’approbation des prêts Exercise 3: Explorer la satisfaction client Exercise 4: Communiquer efficacement des données expérimentales Exercise 5: Gérer les complexités dans les données expérimentales Exercise 6: Vérifier l’hétéroscédasticité de la durée de conservation Exercise 7: Explorer et transformer les données sur la durée de conservation Exercise 8: Appliquer des tests non paramétriques dans l’analyse expérimentale Exercise 9: Visualiser et tester les méthodes de conservation Exercise 10: Analyse approfondie des techniques de conservation des aliments Exercise 11: Félicitations !