ANOVA au sein des blocs d’employés

En vous appuyant sur vos analyses précédentes avec l’entreprise manufacturière, où la productivité des employés a été étudiée à travers différents blocs et où un programme d’incitation a été introduit, vous allez maintenant approfondir les données. L’entreprise dispose d’un jeu de données plus complet dans le DataFrame de productivité, incluant 1 200 employés supplémentaires et leur productivity_score, et a structuré les effectifs en trois blocs en fonction des niveaux de productivité. Chaque employé a été assigné aléatoirement à l’une des trois incitations : 'Bonus', 'Profit Sharing' ou 'Work from Home'.

Avant d’évaluer l’impact global de ces traitements d’incitation sur la productivité, il est crucial de vérifier que l’assignation initiale des traitements était bien aléatoire et équilibrée entre les différents blocs de productivité. Cette étape garantit que toute différence observée de productivité après traitement pourra être attribuée aux programmes d’incitation eux‑mêmes, et non à des disparités préexistantes entre les blocs.

La fonction f_oneway() de scipy.stats a été chargée pour vous.

Cet exercice fait partie du cours

<cours>Conception expérimentale en Python</cours>

Instructions de l’exercice

Regroupez prod_df par la colonne appropriée qui représente les différents blocs de vos données.
Utilisez une fonction lambda pour appliquer le test ANOVA au sein de chaque bloc, en précisant l’argument de la fonction lambda.
Pour chaque groupe de traitement à l’intérieur des blocs, filtrez prod_df selon les valeurs de la colonne 'Treatment' et sélectionnez la colonne 'productivity_score'.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Perform the within blocks ANOVA, first grouping by block
within_block_anova = prod_df.groupby('____').apply(
  # Set function
  lambda x: ____(
    # Filter Treatment values based on outcome
    x[x['____'] == '____']['____'], 
    x[x['____'] == '____']['____'],
    x[x['____'] == '____']['____'])
)
print(within_block_anova)

Modifier et exécuter le code

Cet exercice fait partie du cours

<cours>Conception expérimentale en Python</cours>

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Développer vos connaissances en conception expérimentale vous permet de tester des hypothèses avec des outils d’analyse éprouvés et de quantifier le risque de vos travaux. Vous commencerez par poser les bases de la conception expérimentale et par explorer différents plans, comme le blocage et la stratification. Vous apprendrez ensuite à appliquer des tests visuels et analytiques de normalité sur des données expérimentales.

Exercise 1: Mettre en place des expériences Exercise 2: Affectation non aléatoire des sujets Exercise 3: Affectation aléatoire des sujets Exercise 4: Mise en place des données expérimentales Exercise 5: Bloquer des données expérimentales Exercise 6: Stratifier une expérience Exercise 7: Lequel a été stratifié ?Exercise 8: Données normales Exercise 9: Normalité visuelle dans une expérience agricole Exercise 10: Normalité analytique dans une expérience agricole

Vous étudierez des techniques avancées de conception expérimentale, en vous concentrant sur les plans factoriels, les plans en blocs aléatoires et l’ajustement sur covariables. Ces méthodologies sont essentielles pour améliorer la précision, l’efficacité et l’interprétabilité des résultats expérimentaux. Grâce à un mélange d’enseignements théoriques et d’applications pratiques, vous acquerrez les compétences nécessaires pour concevoir, mettre en œuvre et analyser des expériences complexes dans divers domaines de recherche.

Exercise 1: Plans factoriels : principes et applications Exercise 2: Comprendre l’efficacité d’une campagne marketing Exercise 3: Carte thermique des interactions de campagne Exercise 4: Plans factoriels et plans en blocs randomisés Exercise 5: Plan en blocs randomisés : contrôler la variance Exercise 6: Mettre en œuvre un plan en blocs aléatoires Exercise 7: Visualiser la productivité par bloc et par incitation Exercise 8: ANOVA au sein des blocs d’employés

Exercice actuel

Exercise 9: Ajustement par covariables dans la conception expérimentale Exercise 10: Importance des covariables Exercise 11: Ajustement par covariable avec la croissance des poussins

Maîtrisez des tests statistiques comme les tests t, l’ANOVA et le Chi carré, et approfondissez les analyses post hoc ainsi que les principes de l’analyse de puissance. Apprenez à sélectionner le bon test, interpréter les p-values et les erreurs, et à mener une analyse de puissance pour déterminer la taille d’échantillon et la taille d’effet, tout en tirant parti des bibliothèques Python pour donner vie à vos insights.

Exercise 1: Choisir le bon test statistique Exercise 2: Choisir le bon test : pétrochimie Exercise 3: Choisir le bon test : ressources humaines Exercise 4: Choisir le bon test : finance Exercise 5: Analyse post-hoc après une ANOVA Exercise 6: ANOVA sur les traitements de l’anxiété Exercise 7: Appliquer le test HSD de Tukey Exercise 8: Appliquer la correction de Bonferroni Exercise 9: Valeurs p, alpha et erreurs Exercise 10: Analyser la durabilité des jouets Exercise 11: Visualiser les différences de durabilité Exercise 12: Rôle des seuils de significativité Exercise 13: Analyse de puissance : taille d’échantillon et taille d’effet Exercise 14: Objectif de la taille d'effet Exercise 15: Estimer la taille d’échantillon nécessaire pour l’étude énergétique

Plongez dans les complexités de l’analyse de données expérimentales. Apprenez à synthétiser des insights avec pandas, à traiter des problèmes de données comme l’hétéroscédasticité avec scipy.stats, et à appliquer des tests non paramétriques comme le test U de Mann-Whitney. Découvrez des techniques supplémentaires pour transformer, visualiser et interpréter des données complexes, afin de renforcer votre capacité à mener des analyses robustes dans divers contextes expérimentaux.

Exercise 1: Synthétiser des enseignements à partir d’expériences complexes Exercise 2: Visualiser le rendement d’approbation des prêts Exercise 3: Explorer la satisfaction client Exercise 4: Communiquer efficacement des données expérimentales Exercise 5: Gérer les complexités dans les données expérimentales Exercise 6: Vérifier l’hétéroscédasticité de la durée de conservation Exercise 7: Explorer et transformer les données sur la durée de conservation Exercise 8: Appliquer des tests non paramétriques dans l’analyse expérimentale Exercise 9: Visualiser et tester les méthodes de conservation Exercise 10: Analyse approfondie des techniques de conservation des aliments Exercise 11: Félicitations !