ANOVA
Vous avez maintenant établi l’égalité des variances avec un test de Levene et vérifié visuellement l’approximation de la normalité des salaires après transformation logarithmique : il est temps d’effectuer un test ANOVA ! Rappelez‑vous que l’objectif d’une ANOVA est de déterminer si les entreprises de biotechnologie, de logiciels d’entreprise et de santé ont un financement moyen égal. Étant donné que ces trois groupes satisfont les conditions d’une ANOVA, vous savez que les conclusions de ce test seront valides.
Les DataFrames que vous avez créés (biotech_df, enterprise_df et health_df) ont été chargés pour vous. Les packages pandas sous pd, NumPy sous np, Matplotlib sous plt, et le module stats de SciPy ont également été chargés. Les transformations logarithmiques des montants de financement que vous avez calculées dans un exercice précédent sont aussi fournies.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Instructions
- Réalisez une ANOVA à un facteur en utilisant chacune des trois séries de financements transformées en logarithme, dans l’ordre des arguments suivant : Biotechnology, Enterprise Software, Health Care.
- Affichez si la valeur p est significative au seuil de 5 %.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
biotech_log_funding = np.log(biotech_df['funding_total_usd'])
enterprise_log_funding = np.log(enterprise_df['funding_total_usd'])
health_log_funding = np.log(health_df['funding_total_usd'])
# Conduct a one-way ANOVA test to compare the log-funding
s, p_value = ____
# Print if the p-value is significant at 5%
____